大模型是指網(wǎng)絡(luò)規(guī)模龐大的深度學(xué)習(xí)模型,其參數(shù)量通常在千億級(jí)別。
學(xué)習(xí)大模型需要具備計(jì)算機(jī)基礎(chǔ),這一點(diǎn)非常重要!
要系統(tǒng)地入門大模型,首先需要學(xué)習(xí)深度學(xué)習(xí)的基礎(chǔ)知識(shí),包括神經(jīng)網(wǎng)絡(luò)(NN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等。
在學(xué)習(xí)完基礎(chǔ)知識(shí)后,你可以借助開源算法來學(xué)習(xí)如何使用大模型進(jìn)行自然語言處理任務(wù)。目前有很多大模型開源算法可供學(xué)習(xí)和使用。你可以選擇一些經(jīng)典的大模型算法,如BERT、GPT-2和Transformer等,通過閱讀相關(guān)的論文和代碼實(shí)現(xiàn)來深入了解它們的工作原理和應(yīng)用場(chǎng)景。
本文分為四個(gè)章節(jié),各章節(jié)的學(xué)習(xí)目標(biāo)如下。請(qǐng)注意本文主要是面向工程界撰寫,學(xué)術(shù)部分較少。
入門篇
了解大語言模型的基礎(chǔ)知識(shí)和常見術(shù)語。
學(xué)會(huì)使用編程語言訪問 OpenAI API 等常見大語言模型接口。
提高篇
了解機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、NLP 的基礎(chǔ)知識(shí)。
了解 Transformer 以及典型 Decoder-only 語言模型的基礎(chǔ)結(jié)構(gòu)和簡(jiǎn)單原理。
了解大語言模型發(fā)展歷史,以及業(yè)界主流模型(含開源模型)進(jìn)展。
應(yīng)用篇
可以在本地環(huán)境搭建開源模型的推理環(huán)境。Prompt 工程。
使用已有框架(如Langchain)或自行開發(fā),結(jié)合大語言模型結(jié)果,開發(fā)生產(chǎn)應(yīng)用。
深入篇(本文涉及少量資料)
掌握 Continue Pre-train、Fine-tuning 已有開源模型的能力。
掌握 Lora、QLora 等低資源高效模型訓(xùn)練的能力。
掌握大語言模型微調(diào)以及預(yù)訓(xùn)練數(shù)據(jù)準(zhǔn)備的能力。
深入了解大模型背后的技術(shù)原理。
了解生產(chǎn)環(huán)境部署大模型的相關(guān)技術(shù)點(diǎn)。
讀者可以根據(jù)自己需要選擇對(duì)應(yīng)的章節(jié),如對(duì)大語言模型的原理不感興趣,可只關(guān)注入門篇和應(yīng)用篇??紤]到閱讀背景,本文盡可能提供中文資料或有中文翻譯的資料。
在入門之前,請(qǐng)申請(qǐng) OpenAI API,并具備良好的國際互聯(lián)網(wǎng)訪問條件。
大語言模型綜述 大語言模型迄今為止最好的學(xué)術(shù)向中文綜述。中文版本:LLM_Survey_Chinese_0418.pdf 作為入門資料偏難,看不懂的部分可以等到后面章節(jié)再回頭重看。ChatGPT Prompt Engineering for Developers 雖然是 Prompt 工程,但是內(nèi)容比較簡(jiǎn)單,適合入門者。
中英雙語字幕:https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese OpenAI Quickstart OpenAI 官方 Quickstart 文檔。以及 API Reference State of GPT:GPT 聯(lián)合創(chuàng)始人做的演示,極好的總結(jié)了 GPT 的訓(xùn)練和應(yīng)用。
視頻:https://www..com/watch?v=bZQun8Y4L2A PPT:https://karpathy.ai/stateofgpt.pdf
清華大模型公開課:從NLP到大模型的綜合課程,挑選感興趣的了解。
深度學(xué)習(xí):大學(xué)李宏毅:大學(xué)李宏毅,國語教程里最好的,講的很清楚,也比較有趣。Understanding large language models :理解大語言模型。The Illustrated GPT-2 (Visualizing Transformer Language Models):圖解 GPT2 中文翻譯:https://zhuanlan.zhihu.com/p/139840113
InstructGPT: Training language models to follow instructions with human feedback:著名的 InstructGPT 論文。另外一篇中文介紹:https://huggingface.co/blog/zh/rlhf Huggingface NLP Course:NLP 入門課程 0x30 應(yīng)用篇 Building Systems with the ChatGPT API 中文字幕:https://www.bilibili.com/video/BV1gj411X72B/ Langchain Langchain 是大語言模型最火的應(yīng)用框架。即使不使用,也可以借鑒。
LangChain for LLM Application Development 中文字幕:https://www.bilibili.com/video/BV1Ku411x78m/ GPT best practices:OpenAI 官方出的最佳實(shí)踐。openai-cookbook:OpenAI 官方 Cookbook。Brex’s Prompt Engineering Guide:Prompt 工程簡(jiǎn)介
Huggingface Transformer 文檔:Transformer 官方文檔
復(fù)雜推理:大語言模型的北極星能力 :略學(xué)術(shù),解釋大語言模型能力的來源。
GPT,GPT-2,GPT-3 論文精讀:視頻精讀。Building LLM applications for production:在生產(chǎn)環(huán)境中構(gòu)建 LLM 應(yīng)用。
AI大模型時(shí)代的學(xué)習(xí)之旅:從基礎(chǔ)到前沿,掌握人工智能的核心技能!
這套包含0份報(bào)告的合集,涵蓋了AI大模型的理論研究、技術(shù)實(shí)現(xiàn)、行業(yè)應(yīng)用等多個(gè)方面。無論您是科研人員、工程師,還是對(duì)AI大模型感興趣的愛好者,這套報(bào)告合集都將為您提供寶貴的信息和啟示。
隨著人工智能技術(shù)的飛速發(fā)展,AI大模型已經(jīng)成為了當(dāng)今科技領(lǐng)域的一大熱點(diǎn)。這些大型預(yù)訓(xùn)練模型,如GPT-3、BERT、XLNet等,以其強(qiáng)大的語言理解和生成能力,正在改變我們對(duì)人工智能的認(rèn)識(shí)。 那以下這些PDF籍就是非常不錯(cuò)的學(xué)習(xí)資源。
作為普通人,入局大模型時(shí)代需要持續(xù)學(xué)習(xí)和實(shí)踐,不斷提高自己的技能和認(rèn)知水平,同時(shí)也需要有責(zé)任感和倫理意識(shí),為人工智能的健康發(fā)展貢獻(xiàn)力量。
該階段讓大家對(duì)大模型 AI有一個(gè)最前沿的認(rèn)識(shí),對(duì)大模型 AI 的理解超過 95% 的人,可以在相關(guān)討論時(shí)發(fā)表高級(jí)、不跟風(fēng)、又接地氣的見解,別人只會(huì)和 AI 聊天,而你能調(diào)教 AI,并能用代碼將大模型和業(yè)務(wù)銜接。
該階段我們正式進(jìn)入大模型 AI 進(jìn)階實(shí)戰(zhàn)學(xué)習(xí),學(xué)會(huì)構(gòu)造私有知識(shí)庫,擴(kuò)展 AI 的能力??焖匍_發(fā)一個(gè)完整的基于 agent 對(duì)話機(jī)器人。掌握功能最強(qiáng)的大模型開發(fā)框架,抓住最新的技術(shù)進(jìn)展,適合 Python 和 JavaScript 程序員。
恭喜你,如果學(xué)到這里,你基本可以找到一份大模型 AI相關(guān)的工作,自己也能訓(xùn)練 GPT 了!通過微調(diào),訓(xùn)練自己的垂直大模型,能訓(xùn)練開源多模態(tài)大模型,掌握更多技術(shù)方案。
到此為止,大概2個(gè)月的時(shí)間。你已經(jīng)成為了一名“AI小子”。那么你還想往下探索嗎?
對(duì)全球大模型從性能、吞吐量、成本等方面有一定的認(rèn)知,可以在云端和本地等多種環(huán)境下部署大模型,找到適合自己的項(xiàng)目/創(chuàng)業(yè)方向,做一名被 AI 武裝的產(chǎn)品經(jīng)理。
學(xué)習(xí)是一個(gè)過程,只要學(xué)習(xí)就會(huì)有挑戰(zhàn)。天道酬勤,你越努力,就會(huì)成為越優(yōu)秀的自己。
如果你能在15天內(nèi)完成所有的任務(wù),那你堪稱天才。然而,如果你能完成 60-70% 的內(nèi)容,你就已經(jīng)開始具備成為一名大模型 AI 的正確特征了。
保證100%免費(fèi)
】因篇幅問題不能全部顯示,請(qǐng)點(diǎn)此查看更多更全內(nèi)容
Copyright ? 2019- 91gzw.com 版權(quán)所有 湘ICP備2023023988號(hào)-2
違法及侵權(quán)請(qǐng)聯(lián)系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市萬商天勤律師事務(wù)所王興未律師提供法律服務(wù)