大模型发展之路：向左还是向右？_

ChatGPT一经发布，便迅速在全球范围内掀起了新一轮的人工智能热潮。这款现象级的应用不仅仅是一项技术产品，更是标志着一场技术革命的到来，其背后的大模型正以前所未有的方式改变着我们的世界，并成为了众多科技企业竞相追逐的焦点。

然而，在这场围绕大模型的技术热潮中，不同的技术选择、商业策略和发展理念也引发了广泛的讨论与争议。

开源闭源之争

在大模型领域，开源与闭源的争议尤为突出。国外方面，特斯拉创始人马斯克曾对OpenAI及其CEO萨姆·阿尔特曼(Sam Altman)等人提起诉讼，称他们已放弃了公司的最初使命，即开发人工智能以造福人类而不是为了利润。据报道，马斯克提出了包括违约、违反信托义务和不公平商业行为在内的索赔，并要求该公司恢复开源。

国内方面，百度创始人、董事长兼首席执行官李彦宏是闭源的坚定支持者。今年4月，他在Create百度AI开发者大会上演讲时表示：“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。”

对此，周鸿祎公开反驳称：“我是一直相信开源的力量，至于说网上有些名人胡说八道，你们别被忽悠了。他说开源不如闭源好？连说这话的公司自己都是借助了开源的力量才成长到今天。”

百川智能CEO王小川则在微信群中表达了观点。他认为，开源和闭源并不像手机中iOS或者安卓操作系统只能二选一。从To B角度，开源闭源其实都需要。

实际上，这些争议并不是非此即彼的选择，而是需要根据企业的实际情况、市场需求和技术趋势来综合考虑。开源模型凭借其开放性、创新力和高透明度，赢得了众多开发者和企业的青睐。与此同时，闭源模型则以其出色的性能和严格的知识产权保护，满足了企业对高性能和专业服务的需求。

通用垂直之争

通用大模型与垂直大模型之争，也是大模型领域的一个重要话题。通用大模型凭借其广泛的适应性和强大的学习能力，能够处理多种任务，从文本生成到情感分析，在多个领域展现出广泛的应用潜力。

例如，GPT可以通过大量的文本数据来学习自然语言的规律，具有极高的语言生成能力和自我训练能力，广泛应用于自然语言处理领域。BERT作为一种先进的预训练语言模型，模型能够同时考虑前后文的上下文信息，从而更好地理解语义和语境，主要用于处理文本分类、问答系统、命名实体识别和语义相似度计算等任务。

与通用大模型相比，垂直大模型则以其专业性强、落地速度快的特点，在特定领域内占据优势。

例如，华为云盘古大模型就将重塑千行百业作为发展方向。值得一提的是，在今年的华为开发者大会上，华为云正式发布了盘古大模型5.0。据悉，华为云盘古大模型5.0的应用已经延伸至自动驾驶、工业设计、建筑设计、具身智能、数字内容生产、高铁、钢铁、气象、医药等多个行业及场景。

再比如，京东推出的言犀大模型立足于产业研发。京东方面称，言犀大模型具有更高产业属性、更强泛化能力、更多安全保障，将深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景，解决产业实际问题。

可以说，通用大模型与垂直大模型各有优势，它们在不同的场景和需求下发挥着不同的作用。

自研调用之争

自研大模型与调用第三方大模型服务的争议，同样值得关注。自研大模型能够让企业掌握核心技术和知识产权，形成独特的竞争优势，但需要巨大的投入和长时间的研发周期。仅从训练成本来看，据《ChatGPT 需要多少算力》中估算，GPT-3训练一次的成本约为140万美元，对于一些更大的LLM模型，训练成本介于200万美元至1200万美元之间。

相比之下，调用第三方大模型服务可以快速实现业务需求，降低研发成本和风险，但也可能受限于第三方服务的稳定性和可控性。例如，OpenAI明确表示从7月9日起，将阻止来自未列入OpenAI支持的国家和地区列表的API流量。这意味着，此前希望借助OpenAI大模型套壳创业的公司，将迎来巨大打击。

由此可见，自研与第三方大模型服务的选择取决于企业的战略定位、资源条件以及对核心技术的需求。

写在最后

我们可以看到，围绕大模型技术的争议不仅反映了不同企业在技术选择、商业策略和发展理念上的差异，也为整个行业的未来发展提供了多元化的机会。

对于身处大模型领域的厂商而言，无论是开源与闭源的抉择，通用与垂直的定位，还是自研与调用的战略考虑，都需要根据自身实际情况和市场趋势做出选择。