完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
今天开始学习《大语言模型应用指南》第一篇——基础篇,对于人工智能相关专业技术人员应该可以轻松加愉快的完成此篇阅读,但对于我还是有许多的知识点、专业术语比较陌生,需要网上搜索学习更多的资料才能理解书中的内容,阅读虽慢,但在这一学习过程中也掌握了许多新知识,为后续章节的阅读打下基础,这是一个快乐的学习过程。 基础篇从人工智能的起源讲起,提出了机器能否思考的疑问,引入了图灵机这一神奇的机器。 1.2章节介绍了机器学习,从方法论上来看,机器学习属于归纳推理;从开发设计方式来看,机器学习属于自动编程。我们平时使用各种计算机高级语言编写程序代码,这属于人工编程的范畴;机器学习则由算法自动产生程序,因此这个程序不需要程序员编写,而是由计算机自动生成。因此,人工编程方法依赖程序员思考的规则,而自动编程是计算机算法通过分析数据自行创建规则。 作者通过类比学生准备高考的过程来说明机器学习的过程,如下图: 此章节最后总结了机器学习的分类:有监督学习、无监督学习、半监督学习、自监督学习和强化学习。 1.3章节依次介绍了神经网络的历史、神经网络基础知识、神经网络三要素。对神经网络的核心概念、专业术语定义进行讲解,包括偏置、权重、激活函数;三要素包括网络结构、损失函数和优化方法。章节最后总结了神经网络参数学习的关键步骤。 1.4章节描述了自然语言处理的相关知识点,包括什么是自然语言处理、文本的向量化和自监督学习方法。其中文本向量化中的三种编码方式:独热编码、静态编码和动态编码,这些概念描述是需要时间仔细研究理解的。 1.5章节终于开始讲解大语言模型了,这也是基础篇的最后一章节,占据了基础篇的一半篇幅。首先结合ChatGPT的4次迭代升级介绍了什么是大语言模型,大语言模型的特点:参数多、通用性强;之后用较大的篇幅详细讲解了自然语言处理中的最小处理单位——词元(token),使用了大量的示例帮助读者理解token; 紧随token之后,作者讲解了基于自回归模型的字符预测方法以及文本生成原理,这些知识对我来说有些晦涩难懂,如果要熟练掌握是需要一些时间的,只能后续抽空仔细研读,暂且跳过继续阅读,后面的章节包括统一自然语言任务、大语言模型的训练过程和局限性分析,阅读还算顺利。 至此,基础篇只能算是浏览完成,因为部分原理方法并没有吃透,但尽管如此也是收获颇丰,因为我了解了大语言模型的基础知识和应用过程。 |
|
相关推荐 |
|
《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型
684 浏览 0 评论
【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值
583 浏览 0 评论
《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块
1206 浏览 0 评论
1137 浏览 13 评论
909 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-25 15:53 , Processed in 0.734862 second(s), Total 66, Slave 49 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (威廉希尔官方网站 图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号