Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,3种方式书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品, 5位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!
◎编辑推荐:
适读人群 :适合所有对大语言模型感兴趣的开发者阅读
1. Di一本基于大语言模型进行商业应用开发的书;
2. 以任务(相似匹配、句词分类、文本生成、复杂推理)为中心,内容不仅可用于ChatGPT,也适用于其他大语言模型;
3. 侧重于任务的讲解与设计,思路可用于任何项目;
4. 有详细的示例代码,大部分的代码稍作修改后可用于生产环境,还有Datawhale的HuggingLLM开源教程、B站视频课程,书-课-代码仓库全方位助力学习与实践;
5. Datawhale开源社区又一力作,五位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!
◎内容简介:
随着ChatGPT 的出现,大语言模型的能力得到了业内外的认可,新的商业模式不断涌现,旧的设计和实现都将重构。本书主要介绍基于ChatGPT 开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似ChatGPT 的大语言模型服务来实现以前只有算法工程师才能完成的工作。
全书共8 章内容,第1 章介绍与ChatGPT 相关的基础知识,第2~5 章分别介绍相似匹配、句词分类、文本生成和复杂推理方面的任务,第6~8 章分别介绍ChatGPT 的工程实践、局限与不足,以及商业应用,以帮助读者更好地构建自己的应用。
本书以实践为主,尤其注重任务的讲解和设计,但同时也对自然语言处理相关算法的基本原理和基础知识进行科普性介绍,适合所有对大语言模型感兴趣的开发者阅读。
◎专业书评:
生成式人工智能所训练的大语言模型在内容合成等任务上取得了令人吃惊的进步,可产生新颖甚至是意料之外的结果——这与早期仅仅只会生硬地产生可预测结果的人工智能模型有很大不同,为探索通用人工智能的实现提供了一种方式,引起了各行业的广泛关注。因此我们所处的这个时期被誉为“人工智能的iPhone 时刻”。
这本书是由Datawhale 所推出的力作,秉承了Datawhale“为了学习者”的一贯理念,基于志愿者团队精彩的开源学习内容精心编纂而成,深入浅出地介绍大语言模型的原理和工程实践,对于初学者了解ChatGPT 非常有帮助!
——吴飞,浙江大学人工智能研究所所长
以ChatGPT 为代表的大语言模型技术推动了人工智能的发展,但如何应用大语言模型技术为用户赋能,产生更大的实用价值,仍然有很多现实问题需要去面对和解决。这本书是Datawhale 开源团队结合优质学习内容推出的又一力作,它帮助读者理解大语言模型背后的系统设计,进而能够利用大语言模型来研发自己的AI 产品。书中内容围绕自然语言处理任务展开,很多设计思路和细节其实可以应用到多个领域。期望读者多学多练,能够在实践中提升自我。
——周明,澜舟科技创始人兼CEO,创新工场首席科学家
这本书介绍了如何在大语言模型时代开发自然语言处理算法任务,让普通工程师借助大语言模型也能很快完成自然语言处理任务,在一定程度上降低了人工智能开发的门槛,让更多人有机会参与到人工智能行业的发展中。值得一提的是,这本书虽然以ChatGPT 作为示例,但绝大部分内容都可以无缝切换为其他大语言模型。这得益于本书基于以“自然语言处理算法任务”为核心的设计理念,因而这本书具有更长的生命周期。另外,书中提供的实践经验对自然语言处理算法工程师也具有实践指导意义。
——朱信忠,浙江师范大学人工智能研究院副院长,浙江省特级专家,Datawhale 首席科学家
随着ChatGPT 相关技术的快速发展,越来越多的人关心如何利用大语言模型的强大能力来解决具体问题。这是一本有关大语言模型应用和服务的实践指导书,详细介绍了如何开发基于大语言模型算法的应用和服务。这本书注重实际任务的设计及实现的思路讲解,并提供了对自然语言处理基础知识和算法原理的科普性介绍。相信无论是对大语言模型感兴趣的开发者还是算法工程师,都能从这本书中获益。
——张俊林,新浪微博新技术研发负责人
ChatGPT 已经成为公众关注的焦点,人工智能再次备受瞩目。虽然市面上已经有许多关于如何利用ChatGPT 提高工作效率的图书,但对于深入探讨ChatGPT 本质及其底层的大模型技术的作品却不多见。这本书以明晰而简洁的文字,阐述了大语言模型的工作原理,堪称杰作。更为可贵的是,书中还详细介绍了ChatGPT 的工程实施策略。对于那些渴望深入理解ChatGPT 和大模型技术的读者,我强烈推荐阅读这本书。
——金耀辉,上海交通大学人工智能研究院总工程师、教授
ChatGPT火爆全球,但大语言模型(Large Language Model)才是幕后真正的智能“大脑”!生成式大模型正在开创新的时代,基于生成式预训练大模型的技术突破,也在带来面向个人、深入行业的多重应用。这势必引发新一轮的智力革命和产业重构,构建全新的脑机协作关系。但在同时,与机会如影随形的泡沫也会随之涌现。
为此,本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。本书首先将专业的技术知识通过拟人化的形式进行呈现,生动形象地解释了ChatGPT大模型背后的原理,对这一赋能大模型变革技术与产业的基础能力进行深度剖析;其次,本书以三次工业革命的历史和逻辑作为参照,描绘出大模型将如何驱动社会进入智能革命和脑机协作时代,并为个人和企业应对此次变革提出建议;第三,本书对大模型在知识工作、商业企业、创意娱乐等领域的具体应用进行介绍,总结了企业在自身业务中应用大模型的注意事项和方法论;后,本书对国内外大模型产业的构成和发展进行了分析,并对暗藏泡沫隐患的风险点位做出预警。
《一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革》以通俗易懂的方式从各个层面介绍了AIGC的基础知识,并辅以大量案例引领读者了解AIGC的应用实践,让读者可以更快速地利用AIGC改善工作和生活。
第1章从AI发展历史到资本市场近况阐述了AIGC产业的概况,第2章介绍了AIGC相关技术,第3章介绍了文本类AIGC技术的发展及其在传媒、教育、办公等场景中的应用,第4章介绍了声音类AIGC技术的发展及其在音乐、仿真等领域中的应用,第5章介绍了图片类AIGC技术的发展及其在图片生成、图片处理、图片识别等领域中的应用,第6章介绍了视频类AIGC技术的发展及其在视频生成、数字人等领域中的应用,第7章介绍了AIGC上下游产业链(包括芯片、VR等相关设备、元宇宙建模)的概况,第8章提出了AIGC对人类文明发展产生的影响,并对普通人如何应对AIGC带来的“生产力爆炸”提出方法论。
AIGC带来的生产力变革与每个人都息息相关,本书适合所有人阅读,特别是文本、图片、音视频等各类内容创作者,以及科技行业、金融行业的从业者和对AI领域感兴趣的读者。
无详细内容介绍,四海清单
在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。人工智能绘画作品的夺冠、超级聊天机器人ChatGPT的出现,无疑拉开了智能创作时代的序幕。从机器学习到智能创造,从PGC、UGC到AIGC,我们即将见证一场深刻的生产力变革,而这份变革也会影响到我们工作与生活的方方面面。本书将结合生动的比喻和有趣的案例,向所有关注未来科技的从业者、创业者、投资人、政府部门科普AIGC的商业落地场景和行业应用案例。让我们一起迎接全新的智能创作时代。
ChatGPT一经问世,在全球范围内引起巨大轰动,GPT-4接入未来办公软件更是让人震惊,而且技术正在以前所未有的速度快速迭代。那么,以这些技术为代表的生成式人工智能(AIGC)是否为新一轮的技术革命?它到底能做什么,具有哪些优势和场景应用趋势?面对新技术,未来商业的机会在哪里,对我们个人又有着什么样的影响?……这些问题h对于我们理解当下,面向未来都十分重要。本书基于作者的专业背景和长期实践,系统介绍生成式人工智能的内在逻辑与应用,并将其与产业发展,理论和实际相结合,帮助读者从本源了解生成式人工智能,结合未来趋势和发展为读者指明方向。
这本书的完成并没有花很多时间,却是一场神奇而惊人的旅程,它彻底震撼了我的内心。我只花了5天时间来完成这本书的写作。在让AI辅助写作的过程中,我也学到了很多,以下是我的收获。
本书从使用功法、营销实战、营销组织变革三个层面,系统且深度解读了AIGC如何应用于企业全域、全链路营销。本书所有内容均来自作者的线下企业实训课程,书中包含了课程的所有精华内容。这套实训课程已经有超百家企业报名学习,并得到了企业一致好评。至本书完稿时,几乎所有参与实训的企业都已经落地实践,并获得了远超报名费(每家企业报名费均不低于10万元)的利润。
本书共分为3篇。
上篇(第1~6章):首先讨论了AIGC在营销中的价值和边界。AIGC确实很强大,但并不是万能的,只有充分理解AIGC在营销中的价值和边界才能真正用好AIGC。接着用5章的篇幅介绍文本、图片、视频、音频、数字人、3D建模、动画等各种类主流AIGC工具的使用功法,其中包括GPT-4、DALL-E 3、Midjourney、Stable Diffusion、runway等10余种常见工具和文本SWIFT雨燕功法、图片结构化提示词功法、视频结构化提示词功法等多种作者独创使用功法。按照书中给出的功法去实践,就能生成各种80分(优秀级别)的营销物料。要想实现80分向100分的跨越,本篇也给出了具体的解决方案。
中篇(第7~12章):首先深度剖析数字化时代全域、全链路营销的特点和难点,然后介绍AIGC破解这些难点的方法,接着用4章的篇幅对AIGC在产品设计、取品牌名、制定LOGO、拟定slogan、包装设计、公域内容生产、营销活动、带货直播、私域运营等多个细分领域的应用实践,最后解读在AIGC时代企业进行营销组织变革的路径,并给出企业营销全域、全链路、全组织综合设计方法论。
下篇(第13~16章):跳出营销的范畴,站在整个企业的高度解读AIGC对企业运营的影响。其中重点解读了AIGC对商业环境、商业空间、商业模式的深刻影响,并给出不同规模企业的应对策略。这部分是营销管理者、企业高管、企业家、小微创业者必读的内容。
Sora提升影视制作的效率,引发各种形式的AI应用,具有庞大商业价值 多模态突破的Sora加速推动通用人工智慧的到来 ♔ 从ChatGPT到Sora的AI技术革命 ♔ Sora的诞生和爆发 ♔ Sora多模态跨越式突破 ♔ Sora技术报告全解读 ♔ Sora迈向通用AI ♔ Sora成功背后的技术路线 ♔ Sora带来的产业变革 【内容简介】 2022年ChatGPT横空问世,成为人工智慧的里程碑,而2024年一手打造ChatGPT的OpenAI又发布了文字生成影片大模型Sora,开创了视觉新纪元。只需要一行文字,Sora就能够生成长达60秒的高精细影片,画面不仅一镜到底、多机位切换、完成复杂运镜,还可呈现多变的人物及风景的动态,这意谓着使用者透过简单的文字叙述,就能让Sora创造出任何场景的影片,而打造出创新影片内容的无限可能性。 Sora是人工智慧领域的一次重大突破,更把多模态带往新的发展阶段。未来真正的通用人工智慧将会与人类相仿,可同时利用视觉、听觉、触觉等多种感知模态来理解世界,并对各种模态的资讯整合,而多模态突破的Sora加速推动了通用人工智慧的到来,拓展了人工智慧的应用领域。 Sora除了是一个文字生成影片大模型,还能理解使用者的需求在物理世界中的存在方式,其透过学习影片来理解真实世界的动态变化,并用电脑视觉技术模拟这些变化,从而创造出新的视觉内容。正如OpenAI在技术报告中所说的,Sora有望建构出能够模拟物理世界的通用模拟器,也就是真实世界建模。 Sora的出世,也对各个产业产生巨大的影响及挑战,像是在影音产业、广告行销、游戏、医疗等多个领域上皆有巨大的应用和价值。而本书正是立基于此,内容深入浅出、循序渐进,以Sora为主题,介绍了Sora的诞生和爆发,以及Sora成功背后的技术路线,也对Sora带来的产业变革进行细致和深入的分析,可帮助读者瞭解Sora,并在纷繁复杂的知识海洋中,梳理出认识人工智慧产业变革以及即将到来的通用人工智慧时代的线索。
公文写作是各类组织机构都会涉及的一项重要工作,但传统的公文写作存在容易出错、风格不一致、效率低等问题。在人工智能(AI)技术快速发展的浪潮中,公文写作这项工作也可以借助AI完成“升级”,实现质量和效率的提升。 本书共17章,第1章以《党政机关公文处理工作条例》为依据,介绍公文的特点、作用、写作要点、分类等;第2章介绍常用的AI写作工具;第3章至第17章按照“用公文范本训练AI,撰写提示词,优化提示词,精修初稿”的思路,分别介绍运用AI工具撰写15类公文的具体方法。 此外,第3章至第17章还提供了各类公文的常用句式及金句,供读者参考使用。
本书是关于AIGC(生成式人工智能)技术与作品美学定义方向的探索指南,旨在从美学定义的视角,为创作者提供审美要素、风格要素与应用方向要素的系统指导。在AIGC技术迅速发展的今天,本书强调技术仅是工具,真正的创新源于对美学的深刻理解和高水准的创意思考,我们旨在培养读者形成优秀的美学定义能力,以指导AI生成更高水平、更具深度的优质作品。 本书共8章,第一章简要介绍了AIGC的定义和发展历程等内容,第二章至第八章分别从光、材质、艺术流派、插画、游戏、女性美、流行趋势这几方面,向读者系统展示了在使用AIGC技术生成画面时,如何进行审美要素定义、风格要素定义和应用方向要素定义。 本书适合所有对 AIGC 艺术创作感兴趣的设计师、艺术家和创意工作者阅读。无论是希望提升个人创作的深度和广度,还是渴望在 AIGC 时代保持创新力和竞争力的专业人士,都能从中获得宝贵知识。本书能助益读者激发创作灵感,走出作品同质化的陷阱,为其在广阔的艺术领域产出多样的高质量作品指明方向。
本站基于Calibre构建,感谢开源界的力量。所有资源搜集于互联网,如有侵权请邮件联系。
Github | Docker | Project
Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,3种方式书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品, 5位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!
◎编辑推荐:
适读人群 :适合所有对大语言模型感兴趣的开发者阅读
1. Di一本基于大语言模型进行商业应用开发的书;
2. 以任务(相似匹配、句词分类、文本生成、复杂推理)为中心,内容不仅可用于ChatGPT,也适用于其他大语言模型;
3. 侧重于任务的讲解与设计,思路可用于任何项目;
4. 有详细的示例代码,大部分的代码稍作修改后可用于生产环境,还有Datawhale的HuggingLLM开源教程、B站视频课程,书-课-代码仓库全方位助力学习与实践;
5. Datawhale开源社区又一力作,五位人工智能领域学者吴飞、周明、朱信忠、金耀辉、张俊林亲笔推荐!
◎内容简介:
随着ChatGPT 的出现,大语言模型的能力得到了业内外的认可,新的商业模式不断涌现,旧的设计和实现都将重构。本书主要介绍基于ChatGPT 开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似ChatGPT 的大语言模型服务来实现以前只有算法工程师才能完成的工作。
全书共8 章内容,第1 章介绍与ChatGPT 相关的基础知识,第2~5 章分别介绍相似匹配、句词分类、文本生成和复杂推理方面的任务,第6~8 章分别介绍ChatGPT 的工程实践、局限与不足,以及商业应用,以帮助读者更好地构建自己的应用。
本书以实践为主,尤其注重任务的讲解和设计,但同时也对自然语言处理相关算法的基本原理和基础知识进行科普性介绍,适合所有对大语言模型感兴趣的开发者阅读。
◎专业书评:
生成式人工智能所训练的大语言模型在内容合成等任务上取得了令人吃惊的进步,可产生新颖甚至是意料之外的结果——这与早期仅仅只会生硬地产生可预测结果的人工智能模型有很大不同,为探索通用人工智能的实现提供了一种方式,引起了各行业的广泛关注。因此我们所处的这个时期被誉为“人工智能的iPhone 时刻”。
这本书是由Datawhale 所推出的力作,秉承了Datawhale“为了学习者”的一贯理念,基于志愿者团队精彩的开源学习内容精心编纂而成,深入浅出地介绍大语言模型的原理和工程实践,对于初学者了解ChatGPT 非常有帮助!
——吴飞,浙江大学人工智能研究所所长
以ChatGPT 为代表的大语言模型技术推动了人工智能的发展,但如何应用大语言模型技术为用户赋能,产生更大的实用价值,仍然有很多现实问题需要去面对和解决。这本书是Datawhale 开源团队结合优质学习内容推出的又一力作,它帮助读者理解大语言模型背后的系统设计,进而能够利用大语言模型来研发自己的AI 产品。书中内容围绕自然语言处理任务展开,很多设计思路和细节其实可以应用到多个领域。期望读者多学多练,能够在实践中提升自我。
——周明,澜舟科技创始人兼CEO,创新工场首席科学家
这本书介绍了如何在大语言模型时代开发自然语言处理算法任务,让普通工程师借助大语言模型也能很快完成自然语言处理任务,在一定程度上降低了人工智能开发的门槛,让更多人有机会参与到人工智能行业的发展中。值得一提的是,这本书虽然以ChatGPT 作为示例,但绝大部分内容都可以无缝切换为其他大语言模型。这得益于本书基于以“自然语言处理算法任务”为核心的设计理念,因而这本书具有更长的生命周期。另外,书中提供的实践经验对自然语言处理算法工程师也具有实践指导意义。
——朱信忠,浙江师范大学人工智能研究院副院长,浙江省特级专家,Datawhale 首席科学家
随着ChatGPT 相关技术的快速发展,越来越多的人关心如何利用大语言模型的强大能力来解决具体问题。这是一本有关大语言模型应用和服务的实践指导书,详细介绍了如何开发基于大语言模型算法的应用和服务。这本书注重实际任务的设计及实现的思路讲解,并提供了对自然语言处理基础知识和算法原理的科普性介绍。相信无论是对大语言模型感兴趣的开发者还是算法工程师,都能从这本书中获益。
——张俊林,新浪微博新技术研发负责人
ChatGPT 已经成为公众关注的焦点,人工智能再次备受瞩目。虽然市面上已经有许多关于如何利用ChatGPT 提高工作效率的图书,但对于深入探讨ChatGPT 本质及其底层的大模型技术的作品却不多见。这本书以明晰而简洁的文字,阐述了大语言模型的工作原理,堪称杰作。更为可贵的是,书中还详细介绍了ChatGPT 的工程实施策略。对于那些渴望深入理解ChatGPT 和大模型技术的读者,我强烈推荐阅读这本书。
——金耀辉,上海交通大学人工智能研究院总工程师、教授