您好,歡迎來到網暖!
?
當前位置:網暖 » 站長資訊 » 建站基礎 » 網絡技術 » 文章詳細 訂閱RssFeed

揭秘String類型背后的故事——帶你領略匯編語言魅力

來源:網絡整理 瀏覽:331次 時間:2019-12-06

字符串或串(String)是由數字、字母、下劃線組成的一串字符。一般記為 s=“a1a2···an”(n>=0)。它是編程語言中表示文本的數據類型。在程序設計中,字符串(string)為符號或數值的一個連續序列,如符號串(一串字符)或二進制數字串(一串二進制數字)。
String類型你一定不陌生,畢竟每一位coder都是從var str1 = “Hello World”過來的。
但它真的就只是如此嗎?聽我娓娓道來。
一、思考

在 Swift 開發使用字符串的過程中,你是否有思考過以下問題?

  • 1 個字符串變量占用多少內存?
  • 字符串 str1、str2 的底層存儲有什么不同?
    揭秘String類型背后的故事——帶你領略匯編語言魅力

  • 如果對 str1、str2 進行拼接操作,str1、str2 的底層存儲又會發生什么變化?

揭秘String類型背后的故事——帶你領略匯編語言魅力
如果你能準確地回答以上問題,那說明對 Swift 字符串的底層存儲機制還是比較了解的。

二、1 個字符串變量占用多少內存?

方法 1:MemoryLayout

首先,可以借助 Swift 自帶的 MemoryLayout 來測試一下揭秘String類型背后的故事——帶你領略匯編語言魅力

方法 2:匯編

另外,我們也可以借助一個強有力的底層分析助手—匯編語言,來窺探一下 String 的底層存儲

  • 實際上分析其他語法、系統庫的底層,都可以借助匯編語言

    • 比如多態的原理、泛型的原理、Array 的底層、枚舉的底層等等
  • 另外,不僅僅是 Swift,C、C++、OC 的底層分析,依然可以借助匯編語言

    • 畢竟你寫的每一行有效代碼,最終都是要轉成機器指令(0 和 1)
    • 而機器指令是跟匯編指令一一對應的,每一條機器指令都能翻譯成與之對應的匯編指令
    • 能讀懂匯編指令,就相當于能讀懂機器指令,知道 CPU 具體在干嘛(操作了什么寄存器,操作了哪塊內存)
  • 本教程的代碼是直接跑在 Mac 的命令行(CommandLineTools)項目上
    • 因此展示的匯編代碼是基于 X64 的 AT&T 格式匯編,并非 iOS 真機設備的 ARM 匯編
    • 其實不同種類的匯編之間有極大的相似性,只是有些指令的叫法不一樣

跟微軟的 Visual Studio 一樣,Xcode 也內置了非常方便的反匯編功能,可以輕松查看每一句代碼對應的匯編指令,打開反匯編界面的步驟如下

  • 在某一行需要調試的代碼打上斷點(反匯編界面會在斷點調試狀態下顯示出來)

  • 菜單:Debug > Debug Workflow > Always Show Disassembly

    • Assembly 譯為匯編, Disassembly 譯為反匯編
      揭秘String類型背后的故事——帶你領略匯編語言魅力
  • 運行程序,看到反匯編界面

揭秘String類型背后的故事——帶你領略匯編語言魅力

如果你的反匯編經驗十足,根據第 16、17 行的匯編就可以推敲出來,String 是占用 16 個字節

  • 因為它用了 rax、rdx 寄存器存放字符串 str 的內容,而 rax、rdx 都是 8 字節的

匯編的內容太多了,因為時間和篇幅關系,文章里并不會對每一句匯編指令進行詳細地講解,更多的是想說明匯編的重要性。

三、字符串的底層存儲

窺探內存

此前我寫了個可以窺探 Swift 變量內存的小工具:https://github.com/CoderMJLee/Mems

  • 現在用它來窺探下字符串的 16 字節里面,究竟存儲著什么數據

  • Mems.memStr(ofVal:) 默認情況下按照 8 個字節一組來顯示內存數據

  • 傳遞參數 alignment: .one 是按照 1 個字節一組來顯示內存數據
    揭秘String類型背后的故事——帶你領略匯編語言魅力

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,認真觀察最初 str1 的 16 個字節數據,你發現了什么?

  • 它直接將所有字符的 ASCII 值存儲在 str1 的 16 字節中

  • 最后 1 個字節 0xea 中的 0xa 就是字符的數量,也是共 10 個字符

拼接揭秘String類型背后的故事——帶你領略匯編語言魅力

可以發現,當對 str1 進行拼接 "ABCDE" 的時候

  • 它最終是將 "0123456789ABCDE"十五個字符的 ASCII 值都存儲在了 str1 的 16 字節中

  • 最后 1 個字節 0xef 中的 0xf 就是字符的數量,也是共 15 個字符

  • 可以看得出來,目前 16 個字節已經存滿了,那如果再拼接 1 個字符呢?

    揭秘String類型背后的故事——帶你領略匯編語言魅力

可以看到,str1 里面存儲的數據發生了非常大的變化,每一個字符的 ASCII 值不見了,

  • 那里面的 16 字節具體是什么含義呢?

  • 所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?

其他情況

如果一開始初始化的時候(未拼接之前),字符串的內容就是超過 15 個字符呢?

揭秘String類型背后的故事——帶你領略匯編語言魅力

相信你能猜到是這個結果

  • 這 16 個字節里面并沒有出現任何一個字符的 ASCII 值
  • 而且這 16 個字節跟 第27行的str1 還是有所區別
    • 雖然它們的字符串內容都是"0123456789ABCDEF"

如果對 str2 進行拼接操作揭秘String類型背后的故事——帶你領略匯編語言魅力

不難發現:這時 str2 的 16 字節又發生了變化,跟 第27行的str1 是有點相似的

如何解決上述疑問?

上述的種種疑問,光看打印出來的內存數據是無法解決的,但是都可以利用【!!!匯編!!!】來解決,分析匯編指令,立馬就得出結論,因為文章的篇幅有限,平時工作也比較忙,我把上述問題的詳細剖析過程錄制成了長達 2 個多小時的視頻,有興趣的朋友可以用 1.5~2 倍速度觀看

  • 鏈接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

    • 提取碼:kzrk
  • 視頻對于沒有匯編基礎的朋友來說,可能會有點難度,最好挑一個頭腦清醒的時間去觀看

  • 看完視頻后,希望大家能夠確切地感受到匯編語言的重要性,不要永遠只停留在編寫高級語言代碼、沉迷于語法糖的層面。

    四、最后

最后想多說一句:匯編能給你帶來的價值遠遠不止這篇文章所說的窺探字符串的底層,對你的程序生涯影響絕對是終生受益的(數據結構與算法也是如此),比如你還能玩轉軟件破解、外掛等,這是我此前用【匯編\C++】編寫的一個外掛:https://github.com/CoderMJLee/SeemygoPVZCheater

揭秘String類型背后的故事——帶你領略匯編語言魅力

匯編語言是最接近于機器語言的編程語言。如果說機器語言是計算機操作的本質,那么匯編語言就是最最接近本質的語言。匯編語言能夠讓你更好的理解高級語言,學會匯編后,你可以通過修改高級語言的代碼來提高算法所不能提高的效率。

在編程領域,字符串雖然是所有編程語言中最重要的部分之一,但它也僅僅是這片領域的一隅。對程序員而言,唯有不斷的探索學習更多技術,才能在這片領域中縱橫遨游。

以上就是我的技術分享,感覺意猶未盡還想學的朋友,送福利了!!想獲取更多技術提升秘籍,歡迎×××:×××,我在這里為你隨時解答。這里有很多如 iOS、數據結構與算法等編程技巧的免費視頻和學習資料。

推薦站點

  • 騰訊騰訊

    騰訊網(www.QQ.com)是中國瀏覽量最大的中文門戶網站,是騰訊公司推出的集新聞信息、互動社區、娛樂產品和基礎服務為一體的大型綜合門戶網站。騰訊網服務于全球華人用戶,致力成為最具傳播力和互動性,權威、主流、時尚的互聯網媒體平臺。通過強大的實時新聞和全面深入的信息資訊服務,為中國數以億計的互聯網用戶提供富有創意的網上新生活。

    www.qq.com
  • 搜狐搜狐

    搜狐網是全球最大的中文門戶網站,為用戶提供24小時不間斷的最新資訊,及搜索、郵件等網絡服務。內容包括全球熱點事件、突發新聞、時事評論、熱播影視劇、體育賽事、行業動態、生活服務信息,以及論壇、博客、微博、我的搜狐等互動空間。

    www.sohu.com
  • 網易網易

    網易是中國領先的互聯網技術公司,為用戶提供免費郵箱、游戲、搜索引擎服務,開設新聞、娛樂、體育等30多個內容頻道,及博客、視頻、論壇等互動交流,網聚人的力量。

    www.163.com
  • 新浪新浪

    新浪網為全球用戶24小時提供全面及時的中文資訊,內容覆蓋國內外突發新聞事件、體壇賽事、娛樂時尚、產業資訊、實用信息等,設有新聞、體育、娛樂、財經、科技、房產、汽車等30多個內容頻道,同時開設博客、視頻、論壇等自由互動交流空間。

    www.sina.com.cn
  • 百度一下百度一下

    百度一下,你就知道

    www.baidu.com
?
最牛一尾中特规律