
肖伊最近发现,当Openai国外权力的游戏一次又一次逆转时,除了吃甜瓜之外,国内AI企业家并没有闲着。
有许多程序员在AIGC曲目中静静地赚钱,有些程序正在通过简短的视频中受到打击并接受广告。有些出售AI解决方案;有些出售AI课程;有些人出售AI产品并逐渐变得更大,更强大……更不用说那些赢得了与“ 100万元人民元素”大型模型的“赢家”赢得了与“人均年薪”相关的职位。
您会看到,Pinduoduo进入了大型车型,并以每年一百万的薪水提出了巨大的报价。 Vivo副总裁周还表示,当前的Vivo模型的平均人才成本为100万元。此外,在今年的秋季招聘中,我们可以看到,大型平台正在寻找了解大型型号的人,NLP算法工程师和深度学习等职位是大型模型人才市场中最稀缺,最紧急的人才。
显然,第一个拥抱AI的人已经获得了新世界的票。
小火希望帮助异步粉丝迅速抓住机会并利用大型模特时代。为此,他带来了新加坡科学技术研究局人工智能高级研究员Huang Jia撰写的“如何建立GPT图形模型”。
无论您是NLP领域的学生,对Chatgpt和Generative Models感兴趣的人,还是想开始AI的初学者,都不要错过这本书!
单击图片,
50%的折扣
买书
您应该知道,大多数谈论大型模型的书籍中的大多数书都使用百科全书风格的演示方法来向读者解释现成的知识结论。 “如何构建GPT图形模型”使用问答方法来有趣地解释程序员应该知道并可能对此感到好奇的问题和大型模型的问题和核心技术,并整理出生成语言模型的开发背景。
在这本书中,黄贾先生将带领读者进行探索的旅程,了解Chatgpt的过去和现在,并能够构建0到1的语言模型。
01
谁说大型模特只是一夜之间的热门歌曲?
技术的每一个发展都有其故事的背后
人工智能的概念在1940年代和1950年代开始出现,但直到1956年达特茅斯会议才成为一门独立的学科。
达特茅斯会议吸引了其他领域的许多计算机科学家,数学家和研究人员,他们聚集在一起讨论智能机器的开发前景。他们的共同目标是实现人类智能对计算机的各个方面,为现代人工智能研究开辟道路。从那时起,人工智能领域一直在不断发展,并且出现了许多理论,技术和应用。
人工智能(AI)技术有两个核心应用:计算机视觉(CV)和自然语言处理(NLP)。在AI技术开发的里程碑中,早期突破主要与CV相关,例如CNN和Alexnet。后来突破主要与NLP有关,例如变形金刚和Chatgpt。
从一开始,到寒冷的冬天到发展,再到第二个寒冷的冬天,再到深度学习时代的兴起,再到Chatgpt的光荣时代。可以说,人工智能技术的发展并不顺利:仲夏和寒冷的冬天相互交织在一起,期望和失望融为一体。
自然语言处理技术也是如此。
除了谈论语言模型的原理和守则外,本书中最有趣的事情是Yu老师对自然语言处理技术的演变的普及,什么是语言?信息如何传播?
同时,他让读者了解,自然语言处理技术的演变包含了属于它的一些微妙细节。而且我们对这一过程的经验可以使我们对自然语言处理技术有更深入的了解。
例如,关于NLP的定义,Huang Jia先生在书中描述了以下内容:
“自然语言处理是人工智能的子场,重点是计算机如何理解,解释和生成人类语言。NLP的核心任务是编码和解码人类语言。只有允许计算机理解人类语言,才有可能完成人类只能完成人类才能完成的任务。因此,我们可以说:NLP是人类与计算机之间的交流!”
例如,对于NLP技术的发展,Huang Jia先生将其分为4个阶段,并使用4个单词来总结它们,即原籍,基于规则的,统计,深度学习和大数据驱动,阐明其继承关系。
基于规则和基于统计的语言模型是NLP技术开发的关键节点,大规模语言模型的诞生进一步扩大了NLP技术的应用范围。
在过去的十年中,语言模型接一个地出现了。这本书的宝贵之处在于它可以追踪起源,它不仅允许读者学习语言模型的经典和主流算法,而且还允许读者见证其发展环境,并指导读者思考自然语言处理技术如何逐步发展。
例如,本书选择基于浅神经网络的早期n-gram和NPLM以详细说明,并逐渐过渡到基于深网(一般语言模型GPT)的语言模型。 GPT模型的深网不再使用CNN,RNN或LSTM等结构,而是使用具有更强表达能力的变压器。因此,在解释GPT模型时,Huang Jia老师详细解释了:“变压器的想法是什么,其核心组成部分是什么以及为什么具有更强的表达能力”。
02
如何学习一个不清楚的大型模型?
易于理解且令人难忘的对话 +插图方法
说到这一点,我相信每个人都对NLP的发展,大规模培训模型的发展,甚至从宏观角度从GPT-4开发到GPT-4的发展有一定的了解。
在这本书中,黄色老师将遵循自然语言处理技术的发展,以向读者解释其技术优先事项,并与所有人一起练习,并逐步带您完成GPT。
正如Huang Jia先生所说:“今天,尽管我们对Chatgpt和GPT-4等大型模型的神奇能力感到惊讶,但让我们对他们的基本逻辑和技术进行了认真而快乐的探索。对我来说,这也是朝圣之旅,这是一种朝圣的旅程,是一种在人工智能和自然语言处理技术中进行70年的艰苦发展的旅程。”
从n-gram,word(bow),word2vec(word to vector,w2v),神经概率语言模型(NPLM),复发性神经网络(RNN),seq2seq(seq2Seq(序列到序列,s2s),注意力机制,注意力机制,变形金刚,变形金刚,bert to bert to gpt,许多令人惊叹的大个子,许多知识和许多程序都构成了许多程序和许多计划。对于许多程序员来说,独自学习原理和代码也很麻烦且难以进行。
对于已经拥有基金会的程序员来说,这是正确的,更不用说零基础的新手了吗?
这组书籍令人惊讶的是,它试图使用问答的教学方法,以及图片和文本的解释,专注于初学者学习中的真实问题,一个一个一个,解释语言模型并解码技术。
例如,在介绍n-gram时:
本文的每个部分都将小宾的问题作为线索,介绍最新的热门话题,并在不同时间和场景中使用同事的对话来讲述故事。它以易于理解的方式分析了与大型模型相关的知识,并解释了语言模型和算法背后的含义。
小ob是一个充满好奇心的初学者,他是现在生活的人。她的问题正是我们问的问题,而她不太完美的答案正是我们目前的想法。
KA兄弟是一位知识渊博,幽默和有趣的技术专家,他喜欢回答问题并回答问题。他的特殊演讲也在书中“附加”,记录了相应的原则和代码,并专业地回答了相关的问题。
在小小的解释和兄弟ka的解释下,黄贾先生以易于理解的语言表达了晦涩的知识,具体化的抽象概念,并且轻松而幽默地回答了初学者可能对大型模型感到好奇的各种问题。
翻阅这本书时,如下各章的标题也令人印象深刻:
序言似乎是普通的,也是最非凡的,但是很容易但很困难
第1课:语言模型n-gram和简单文本表示单词的原型
第2课:文字是什么?
第3课:没有办法要走:神经概率语言模型和复发性神经网络
第4课:另一个光村:Seq2Seq编码器 - 解码器体系结构
第5课:学习最小的知识并知道它会睁开您的眼睛:引入注意机制
第6课:构建GPT核心组件变压器
第7课Fanglin Xinye敦促Chen Ye:训练您的简单版本的生成GPT
第8课:基于人类反馈的Chatgpt加强学习
第9课无尽的循环:使用强大的GPT-4 API
后记,不要等待,男孩的头不见了
Huang Jia老师以“古代诗歌 +章节内容”的形式说明不同语言模型的每一章。他们中的大多数是对古代诗歌的改编,还有隐喻,并使用了简短的诗歌,但具有深刻的含义,可以提取大型模型的特征和语言模型的发展背景,因此知识点是直观,易于理解且易于记住的。
03
如何建立一个难以学习的大型模型?
生动有趣的图纸,巧妙的项目设计,详细的代码,数据集
Huang Jia先生是新加坡科学技术研究局人工智能的高级研究员。他的主要重点是NLP大型模型,连续学习,金融科技AI和光谱数据中的AI的研究,开发和应用。
他撰写了许多畅销书,例如“从零基础中学习机器学习”和“十个数据分析情节”。他已经深入研究数据科学领域已有多年了,并且在政府,银行,能源,医疗服务等领域实施AI项目方面积累了丰富的经验。
因此,在本书中,他不坚持理论的积累,而是将读者从基本到高级,从理论模型到实践分析,以便读者可以真正了解如何建立大型模型。
例如,ChatGpt属于大语言模型的类别。然后,Huang Jia老师将首先以流行的方式解释本书中的“什么是语言模型,什么是大型语言模型”。在解释语言模型时,它将在NLP字段中介绍几个最常用的概念,例如单词向量和词嵌入,以及经典的方法Word2Vec。
目前,在大型模型的教学中添加锦上添花非常重要。作为技术书籍的重要组成部分,插图也是初学者更直接吸收知识的一种手段。
这次,书中的插图捕捉了黄贾老师的解释的技术本质,在解释技术原理的同时,它是生动而幽默的。除插图外,书中还有大量表,以帮助读者尽可能多地了解相关问题。
图片和文本的解释方法使读者可以快速理解相关的技术知识,而动手代码实践使读者可以轻松地构建大型模型,更不用说这本书具有两者。
Huang Jia老师将根据技术发展的背景来解释本书中的多个实用项目,并使用生动而活泼的笔触将无聊的技术细节转变为轻松而幽默的故事和色彩丰富的图片,并逐步教授代码评论,以逐步教授读者来教读者进行实际战斗。
项目1:n-gram构造
项目2:Word2Vec构造
项目3:NPLM的构建(神经概率语言模型)
项目4:SEQ2SEQ架构
项目5:注意机制
项目6:变压器体系结构
项目7:Wikigpt
项目8:Minichatgpt
令人惊讶的是,本书还提供了支持资源代码和实例数据集的实例资源,这些资源可以帮助读者更好地了解书中的概念和实用技术。通过示例代码,初学者可以直接尝试运行代码,并通过练习加深对书籍中内容的理解。实例数据集可以帮助读者在处理真实数据时执行实用操作,以更好地掌握相关技术。
读完这本书后,小火忍不住了:这有多有趣!在攀登新技术峰的美好旅程中,我们不仅可以深入了解自然语言处理技术的核心原则,而且可以自己做,并在从头开始就在语言之后建立语言模型,充满成就感!
Xiaoyi认为,无论您是学生还是人工智能从业者,这本书都将成为一个灯塔,阐明您探索人工智能无限奥秘的道路!
单击图片购买书50%的折扣
参考:
1。生成的预训练的语言模型:理论和实践深蓝色学院 - 一个专注于人工智能和自动驾驶的学习平台;
2。超人离开后,Openai的竞争对手赶往偷猎员工;
3。微软希望赢得OpenAI董事会的席位。
入门:从零基金会学习Python的最完整问题|来自零基金会的Python 8个月|实用项目|学习python是这个捷径
仪器:爬行douban简短评论,电影“美国后来” |分析38年内NBA最佳球员|从期望到穷人的声誉!唐侦探3令人失望|笑着观看天堂之剑和龙军刀的新传奇|谜语回答国王|使用Python制作大量的年轻女士的草图|任务:不可能受欢迎,我使用机器学习制作迷你推荐系统电影
娱乐:弹球游戏|九个网格|美丽的花朵| 200行Python“每日酷跑”游戏!
AI:可以做诗歌的机器人|颜色图片|预测收入|任务:不可能是如此受欢迎,我使用机器学习制作迷你推荐系统电影
小部件:pdf到Word,很容易获得表格和水印! |单击将HTML网页另存为PDF! |再见PDF提款费! |使用90行代码来创建最强的PDF转换器,单击Word,PPT,Excel,Markdown和HTML |的一键转换|创建DingTalk低价空中票证示例! | 60行代码使语音壁纸切换器每天都观看年轻女士! |