近来,百度集团副总裁吴甜与界面新闻等多家媒体共享了百度“文心大模型”的最新开展。
吴甜表明,2022年是“文心大模型”工业落地要害年,现在“文心大模型”已大规模使用于百度内部的各类产品,包含查找、信息流、小度智能屏、百度地图等,而“文心大模型”的个人、企业开发者数量已超越6万人。
跟着数据井喷、算法前进和算力打破,泛化才能和通用性强的预练习大模型正在成为人工智能开展的要害方向,并成为人工智能工业使用的重要推动力。
人工智能技能要想在传统工业晋级转型的过程中完成遍及,需要与各行各业的差异化场景深度交融,而大模型能加快这种交融的开展:它经过会集供给通用算法模型,打造技能底座,让大多数企业的标示数据更少、开发功率更高、使用本钱更低,然后大幅下降人工智能的使用门槛。
2019年3月,百度发布我国首个正式敞开的预练习模型ERNIE1.0;2021年12月,ERNIE 3.0晋级为常识增强千亿大模型“鹏程-百度文心”。
在吴甜看来,“文心大模型”作为工业级大模型,中心价值在于驱动人工智能的规模化使用,吸纳更多开发者参加其间。
所以,为了进一步下降人工智能的使用难度,“文心大模型”还为开发者供给了东西渠道,配套易上手的大模型开发、轻量化、布置东西,让各行各业的开发者都能低门槛完成人工智能的使用。
吴甜介绍称,经过大模型与国产深度学习结构交融开展,百度现已构建出自主立异的AI基底,能驱动人工智能的规模化使用。
百度方面表明,支撑“文心大模型”高效分布式练习的要害技能,是百度飞桨渠道自主研制的端到端自适应分布式练习结构与4D混合并行技能。
吴甜告知界面新闻等媒体,根据百度飞桨渠道与百舸集群,“文心大模型”在算法、结构、算力层面完成了自主立异。
百度官方还称,现在公司多个大模型现已处于领先水平,包含全球首个百亿参数中英文对话大模型PLATO-XL、聚集中英文场景大规模OCR结构化预练习模型VIMER– StrucText、中文跨模态生成模型ERNIE-ViLG等。