大模型发展之路:向左还是向右?

大模型发展之路:向左还是向右?
2024年08月16日 16:33 ChinaByte比特网

ChatGPT一经发布,便迅速在全球范围内掀起了新一轮的人工智能热潮。这款现象级的应用不仅仅是一项技术产品,更是标志着一场技术革命的到来,其背后的大模型正以前所未有的方式改变着我们的世界,并成为了众多科技企业竞相追逐的焦点。

然而,在这场围绕大模型的技术热潮中,不同的技术选择、商业策略和发展理念也引发了广泛的讨论与争议。

开源闭源之争

在大模型领域,开源与闭源的争议尤为突出。国外方面,特斯拉创始人马斯克曾对OpenAI及其CEO萨姆·阿尔特曼(Sam Altman)等人提起诉讼,称他们已放弃了公司的最初使命,即开发人工智能以造福人类而不是为了利润。据报道,马斯克提出了包括违约、违反信托义务和不公平商业行为在内的索赔,并要求该公司恢复开源。

国内方面,百度创始人、董事长兼首席执行官李彦宏是闭源的坚定支持者。今年4月,他在Create百度AI开发者大会上演讲时表示:“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”

对此,周鸿祎公开反驳称:“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”

百川智能CEO王小川则在微信群中表达了观点。他认为,开源和闭源并不像手机中iOS或者安卓操作系统只能二选一。从To B角度,开源闭源其实都需要。

实际上,这些争议并不是非此即彼的选择,而是需要根据企业的实际情况、市场需求和技术趋势来综合考虑。开源模型凭借其开放性、创新力和高透明度,赢得了众多开发者和企业的青睐。与此同时,闭源模型则以其出色的性能和严格的知识产权保护,满足了企业对高性能和专业服务的需求。

通用垂直之争

通用大模型与垂直大模型之争,也是大模型领域的一个重要话题。通用大模型凭借其广泛的适应性和强大的学习能力,能够处理多种任务,从文本生成到情感分析,在多个领域展现出广泛的应用潜力。

例如,GPT可以通过大量的文本数据来学习自然语言的规律,具有极高的语言生成能力和自我训练能力,广泛应用于自然语言处理领域。BERT作为一种先进的预训练语言模型,模型能够同时考虑前后文的上下文信息,从而更好地理解语义和语境,主要用于处理文本分类、问答系统、命名实体识别和语义相似度计算等任务。

与通用大模型相比,垂直大模型则以其专业性强、落地速度快的特点,在特定领域内占据优势。

例如,华为云盘古大模型就将重塑千行百业作为发展方向。值得一提的是,在今年的华为开发者大会上,华为云正式发布了盘古大模型5.0。据悉,华为云盘古大模型5.0的应用已经延伸至自动驾驶、工业设计、建筑设计、具身智能、数字内容生产、高铁、钢铁、气象、医药等多个行业及场景。

再比如,京东推出的言犀大模型立足于产业研发。京东方面称,言犀大模型具有更高产业属性、更强泛化能力、更多安全保障,将深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决产业实际问题。

可以说,通用大模型与垂直大模型各有优势,它们在不同的场景和需求下发挥着不同的作用。

自研调用之争

自研大模型与调用第三方大模型服务的争议,同样值得关注。自研大模型能够让企业掌握核心技术和知识产权,形成独特的竞争优势,但需要巨大的投入和长时间的研发周期。仅从训练成本来看,据《ChatGPT 需要多少算力》中估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。

相比之下,调用第三方大模型服务可以快速实现业务需求,降低研发成本和风险,但也可能受限于第三方服务的稳定性和可控性。例如,OpenAI明确表示从7月9日起,将阻止来自未列入OpenAI支持的国家和地区列表的API流量。这意味着,此前希望借助OpenAI大模型套壳创业的公司,将迎来巨大打击。

由此可见,自研与第三方大模型服务的选择取决于企业的战略定位、资源条件以及对核心技术的需求。

写在最后

我们可以看到,围绕大模型技术的争议不仅反映了不同企业在技术选择、商业策略和发展理念上的差异,也为整个行业的未来发展提供了多元化的机会。

对于身处大模型领域的厂商而言,无论是开源与闭源的抉择,通用与垂直的定位,还是自研与调用的战略考虑,都需要根据自身实际情况和市场趋势做出选择。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部