2023年初,能够和人类进行对话的聊天机器人ChatGPT火爆全球,与Siri、小爱同学等只能进行简单对话和执行简单指令的机器人不同,它是由美国顶级AI创企OpenAI在2022年底上线的对话式AI模型,能够执行回答问题、写论文、查找代码和写代码等复杂的高难度指令。
ChatGPT上线不到一周后,用户数量就突破100万,不到两个月的时间,ChatGPT的日活量已突破千万,堪称神速。
而应用的背后,支撑它的是早已起步的AI大模型,AI大模型指的是在大规模宽泛的数据上进行训练后,能适应一系列下游任务的模型,它包含了“预训练”和“大模型”两层含义,在面向实际任务建模前,会在海量数据上进行预先训练,因此能够大幅度提升AI的实用性和通用性。
近年来,AI大模型作为越来越热门的赛场,吸引着众多科技巨头纷纷入局,自2020年Open AI推出NLP大模型GPT3以来,AI大模型在全球范围内迎来了爆发式的增长。国外如OpenAI、谷歌、微软、英伟达等海外公司纷纷布局AI大模型产业,国内的华为、阿里、百度、浪潮等大型企业,以及中科院自动化所等科研机构也加入研发赛道。与此同时,AI大模型的参数量级也在不断增高,从千亿、万亿跃升到了10万亿级别。
据悉,微软即将投入使用的新版AI搜索引擎和Edge浏览器,由比ChatGPT更强大的下一代OpenAI大模型提供技术支持,至此,搜索引擎将迎来大变局。百度官宣也将于今年3月发布大模型新项目“文心一言”,今后搜索引擎将不再是简单的信息查询工具,引入人工智能聊天功能后的搜索引擎更像一个聪明的全能助理,写邮件、写论文、行程安排、翻译,聊天交互,它都可以。未来,我们仍然有可能继续看AI一本正经的胡说八道,但同时也将带给我们全新的搜索体验。
目前,除了ChatGPT,AI大模型在许多领域广泛应用着,如自然生态检测、灾害评估、医药研发等方面,AI大模型都发挥着巨大的价值。尤其是AIGC领域,发展堪称迅速,随处可见AI大模型的身影,比如写一篇文章,在大模型中输入关键词、主题、文本风格等关键词后,就可以生成一个符合条件的文本;在金融等领域,大模型通过抓取行业数据,能够自主完成筛选、分析,并生成行业报告,辅助从业人员做决策。
可以看出,AI大模型的潜力深厚,在各个领域的落地和应用都有着广阔的前景。当然,AI大模型也存在着许多等待克服的难题,如大规模、高质量的数据集开发、高昂的运行成本、大模型与产业的具体结合等等。但从AI大模型的发展现状来看,我们有理由相信它能克服困难,不断发展,从而推动人工智能更好地落地。