這個系列的文章,大約會有8到10篇吧,現(xiàn)在已經(jīng)寫完了6篇了,分開來發(fā)吧,據(jù)說分開發(fā)流量會大一些。
自從前年年底大模型出來了以后,就想著搞一臺臺式機來學習學習大模型和機器學習,免得落伍太多了,看配置,看B站視頻,選配置,看二手顯卡,一手顯卡,對比顯存,仿佛又到了大學時期那個攢機器的時代,這么過去了幾個月,一直沒有下手,感覺這里面水實在是太深了,二手的不敢隨便買,太便宜的怕遇到礦卡,太貴的又覺得有點虧,一手的新的又沒有價格合適的顯存又大的,就算有也基本上是缺貨狀態(tài),得碰運氣搶,本來預算大概是2萬到3萬左右,看了半年沒看到什么合適的,如果直接買高配的品牌配置好的游戲主機吧,一般顯存也不太夠,而且也怕買回來以后沉迷到游戲里面去,加上自己本身也過了那個喜歡折騰的年齡了,就想安逸的搞個機器玩玩,于是就這么一直拖下來了。
后來,蘋果開發(fā)布會了,看完蘋果的產(chǎn)品發(fā)布會以后,Mac Studio給了我很深的印象,顯存內(nèi)存一體式的架構,這不輕松讓顯存達到100GB級別,一個100GB的顯卡就搞定了么,網(wǎng)上一查,主流的機器學習庫(torch,tf)也已經(jīng)適配Mac的Metal架構和M系列芯片了,可以使用Mac的GPU加速能力,那這Mac Studio不就是專門搞大模型的了么,也玩不了什么游戲,于是想也沒想,斥巨資搞了一臺Mac Studio來“學習”了,是真學習。
經(jīng)過我粗糙的計算:一個192GB的mac studio大概四萬元,相當近200來GB的顯存,你要買個200GB顯存的nv顯卡機器,配個六塊3090或者4090也不夠吧,在配個好點的其他配置,怎么也要個六七萬吧,而且功率賊高,聲音賊大,而同樣價格的mac,功率200多W,還要怎樣,就算速度慢十倍又如何,個人用,大部分時間是用來在本地模型上做推理的應用開發(fā),開發(fā)一些好玩的東西,最多最多就用來微調(diào)微調(diào)模型,足夠了,你還指望靠這個訓練一個自己的大模型???使用Mac Studio可以在不使用量化的情況下,直接載入滿血版的llama模型,試問消費顯卡得配幾張才做得到?而且我相信后面機器學習庫對mac的適配性肯定會越來越好,真的萬萬沒想到,蘋果有一天也會和性價比沾上邊。
機器到手以后,第一時間開機,熟悉的界面,熟悉的操作,首先得把環(huán)境配置好。
DDDD,這里就不詳細說了。
Edge,沒什么好說的,自從用了這個以后,就再也沒有打開過chrome了。
一直使用搜狗輸入法,其他的也沒用過
brew安裝的話,由于大家都懂的原因,可以選擇國內(nèi)的源進行安裝,雖然之前已經(jīng)了,但畢竟國內(nèi)的源速度更快,這里推薦清華的源和中科大的源,后來發(fā)現(xiàn),也可以使用阿里云的源,這個源我感覺比大學的源同步得更新一些,而且比較穩(wěn)定,可以按照以下步驟進行安裝,非常簡單
bash
復制代碼/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
安裝完成以后就可以使用brew安裝各種各樣的軟件了
iTerms和zsh是mac下最重要的終端工具,在安裝完了brew以后,可以直接使用brew安裝這兩個軟件,具體的配置,網(wǎng)上到處都是,就不在這里浪費筆墨了。
現(xiàn)在也可以使用WARP這個軟件,主打一個不用折騰。
這個也沒什么好說的,我一直都是用的語雀,yuque.com可以直接安裝對應的版本。前幾天還擼了個半年的會員。
這個就是VSCODE了,各種插件根據(jù)個人喜好安裝吧,另外,我買了一個Copilot,就一個字,好用不虧。
在安裝深度學習軟件之前,會涉及到各種各樣的平臺,各種各樣的軟件,我們首先需要了解一些概念: 先要確定你的機器硬件是不是可以做這個事情,當然,純CPU運算也可以做機器學習,只是很慢而已,所以硬件上大致分為三類:
除此之外,軟件部分也有一些需要提前了解的,就目前來說,有幾個軟件是必裝的,如conda,python,torch,transformers,jupyter,這些我在下面一一介紹一下
首先安裝的是conda,conda你可以簡單理解為一個包管理軟件,并且我們只需要安裝miniconda就可以了,不需要安裝完整版本。在選擇一個你需要的版本直接安裝就可以了,我選的Apple M1芯片的。
安裝的過程比較簡單,直接按照步驟執(zhí)行就可以了。安裝完成以后就可以使用conda命令安裝python等其他軟件包了,注意,在這里先不要安裝torch,我們要根據(jù)自己的情況來安裝對應版本的torch,不然的話沒辦法使用上apple的gpu資源。
conda有個比較好的功能就是新建一個環(huán)境,這個環(huán)境是一個的環(huán)境,每個環(huán)境中可以有他自己的torch,python等軟件的版本,方便在各個環(huán)境下使用不用的軟件
conda create env_name 新建一個env環(huán)境 conda activate env_name 切換到env環(huán)境
安裝完conda以后,順手也可以通過conda把jupyter給安裝掉,安裝notebook或者lab都可以,lab更強大一些,但是notebook也完全夠用了。
conda install jupyter lab
安裝好了以后,使用jupyter lab命令或者jupyter notebook命令啟動,啟動完成以后就可以正常使用了。 jupyter這里多說一句,自從用了vscode以后,jupyter的網(wǎng)頁版再也沒有打開過來,只需要在vscode上安裝好python插件就行了,直接可以新建出jupyter的文件,然后和網(wǎng)頁版的jupyter的使用方式一模一樣,沒必要再去折騰notebook的網(wǎng)頁版了。而且在vscode的jupyter里面還可以用Github Copilot,方便很多。
打開torch的官網(wǎng),找到你對應的版本,使用pip3或者conda安裝即可,寫這篇文章的時候,pytorch正式版還沒有支持apple的m芯片,但是現(xiàn)在的2.3.0已經(jīng)支持了,所以直接安裝就行
pip3 install torch torchvision torchaudio
在發(fā)布這篇文章的時候,torch官網(wǎng)已經(jīng)更新了torch的2.3.0正式版,2.3.0正式版也已經(jīng)支持M芯片了。 這樣你的torch就是對應正常版本了,你可以通過一下方式來確認:
python復制代碼import torch
torch.device('mps')
其他庫的安裝就是一個按需安裝的過程了,你可以通過conda也可以通過pip3安裝,都差不多,我一般習慣使用pip3安裝,conda僅僅用來進行環(huán)境的一些設置。
接下來,在后面的章節(jié)中,我們要開始真正的大模型之旅了。
讀者福利:如果大家對大模型感興趣,這套大模型學習資料一定對你有用
對于0基礎小白入門:
如果你是零基礎小白,想快速入門大模型是可以考慮的。
一方面是學習時間相對較短,學習內(nèi)容更全面更集中。
二方面是可以根據(jù)這些資料規(guī)劃好學習計劃和方向。
大模型AGI學習包
《人工智能\大模型入門學習大禮包》,可以掃描下方二維碼免費領取!
因篇幅問題不能全部顯示,請點此查看更多更全內(nèi)容
Copyright ? 2019- 91gzw.com 版權所有 湘ICP備2023023988號-2
違法及侵權請聯(lián)系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市萬商天勤律師事務所王興未律師提供法律服務