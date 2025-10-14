瑞士开放式人工智能的利与弊

瑞士人工智能模型Apertus自今年9月初问世以来，与其相关的讨论和报道便一直层出不穷。然而，当中的真实与虚假，人们应当如何分辨？ Keystone / Gaetan Bally

从二十世纪中叶起步至今，人工智能迅速改变着我们的世界。最近，瑞士联邦理工学院发布了一款名为Apertus的大规模人工智能新模型。对此，外界的反响可谓褒贬不一。在受到一部分人追捧的同时，该模型的问世也遭到了反对一方的抨击。与此同时，与这项新技术相关的话题也在市场上迅速流传开来。本文将针对那些流传最为广泛的观点展开深入的探讨与分析。

经过数周的等待，苏黎世联邦理工学院(ETH Zürich)和洛桑联邦理工学院(EPFL)终于在近日将名为Apertus的国家级大型语言模型(LLM)推向了市场。由于该模型的全部组件均对外界公开，开发团队将其定义为一款“完全开放式”的人工智能。此外，鉴于其极高的透明度和多样性，该模型还被誉为“生成式人工智能领域的里程碑”。然而，关于Apertus这款人工智能模型的功能与弊端却存在诸多说法。其中，哪些观点属实？哪些又是误传？

为了回答这一问题，在对这款最新的人工智能模型进行测试的同时，瑞士资讯还邀请了其开发团队及其他人工智能专家对以下观点进行真伪区分并揭秘分析该模型的主要优势与不足之处。

Apertus是瑞士版的ChatGPT：非事实

不同于OpenAI的ChatGPT，Apertus的设计初衷并非为了个人用途。恰恰相反，作为一款基础类人工智能模型，瑞士开发Apertus的意图在于让其与各类应用及服务程序完成适配，而商业和科研则将成为该模型的重点投放领域。举例来说，Apertus不仅可用于电子商务，在医疗领域，人们也可利用该模型实现多语言信息的提取。

负责Apertus技术开发工作的苏黎世联邦理工学院研究员伊马诺尔·施拉格(Imanol Schlag)表示：“大众市场并非我们的首要目标客户群体。”

正因如此，Apertus既没有推出太多面向私人用户的功能，也没有推出一套专属的移动应用程序。

位于卢加诺的瑞士国家超级计算中心(CSCS)拥有一台用于管理Apertus人工智能模型的超级计算机。该中心的助理主任玛丽亚·格拉齐亚·朱弗雷达(Maria Grazia Giuffreda)解释道：“我们的设计意愿从来不是开发一套瑞士版的ChatGPT。”

为了让公众有机会体验这款新型人工智能模型，非政府组织Public AI在其官方网站上向互联网用户开放了Apertus的部分聊天功能。

Apertus无法与市场上的主流大型语言模型抗衡：事实

通常情况下，大型语言模型的学习能力可通过参数量这项指标反映出来。作为目前已知功能最为强大的完全开源式大型语言模型，Apertus的最大版本拥有700亿个参数。尽管如此，该人工智能依旧无法与GPT-4、Gemini或Claude这类专有模型相媲美。事实上，上述这些大型语言模型不仅依靠更为庞大的数据集完成训练，背后还同时拥有强大计算能力的支持。与Apertus相比，GPT-3拥有的参数高达1750亿个，而其后续版本的具体参数数量则并未公开。

对此，巴黎综合理工学院(École polytechnique)的教授埃尔·马迪·埃尔·马姆迪(El Mahdi El Mhamdi)表示：“将Apertus与美国科技巨头企业开发的人工智能模型进行对比，就如同将一个瓦莱州的小农户与一家超大型牛肉生产商拿来比较一般毫无意义。”

然而，规模较小的人工智能模型不仅可能更加高效且更适合中小企业使用，在能源消耗方面，也可能更加经济实惠。针对这一点，洛桑联邦理工学院和瑞士意大利语区大学(Università della Svizzera italiana)的研究员梅特·伊斯迈伊兹扎达(Mete Ismayilzada)补充道：“人们越来越意识到，数据的质量远比其数量重要得多。”

与此同时，部分学界人士对瑞士开发的新人工智能模型持怀疑态度。苏黎世大学的名誉教授布鲁诺·弗雷(Bruno Frey)透露道，Apertus模型向他提供了错误的科学依据。在这位专家看来，“这些数据的说服力明显不足。”另一边，数学家泽维尔·孔特塞 (Xavier Comtesse) 也在领英发文指出，该人工智能模型会产生大量看似准确实则错误的结果。这一现象在人工智能领域里亦被称作人工幻觉。

施拉格却为Apertus的性能表现进行了辩护。该专家指出，作为大型语言模型，Apertus最小的版本也拥有80亿个参数。该参数数量不仅已超越了Mistral、Meta以及阿里巴巴等科技公司开发的类似产品，同时也领先于所有其它公共机构所使用的人工智能语言模型。

相较于其它人工智能模型，Apertus秉持伦理规范且透明公开：事实

自2024年欧洲人工智能法案生效以来，Apertus是首个在满足该法案关键要求的前提下被设计开发出的大规模人工智能模型。这些关键性的法律要求囊括了透明度、数据可追溯性以及对知识产权及隐私的尊重。作为大型语言模型，Apertus的设计架构、权重(决定神经网络运作的数值参数)以及训练指令均向公众开放，而用于模型训练的数据集则均出自于公开且合法的来源，但并不包括受版权保护的作品或拒绝加入训练数据集的网站。

与之相反的是，科技巨头们长期以来一直在未经同意的情况下使用数十亿用户的数据，而受版权保护的数据甚至也未能幸免。埃尔·马迪·埃尔·马姆迪指出，这些数据往往通过利用发展中国家隐蔽且廉价的人力劳动搜集而来。该专家表示：“数据滥用在主流现代化人工智能供应链中几乎已成常态，而对于其恶劣程度，我们仍未获得清醒的认知。”

在生成式人工智能时代捍卫人权和信息完整性 2019冠状病毒病大流行过后，ChatGPT和DALL-E等生成式人工智能平台得到了广泛应用，极大改变了人类数字生活的方方面面。通过自然语言生成和大语言模型，生成式人工智能已成为高效的生产力工具。然而，随着人工智能系统越来越多地纳入数字化平台，一系列重大危害也随之浮现。 人工智能生成或介导的内容往往非常逼真，难以辨伪，且传播迅速。如果此类内容传递虚假或误导性的信息，则可能会加剧信任赤字。然而事实上，大语言模型的设计初衷并非传递真相。相反，大语言模型并不保证内容的准确性或真实性，仅仅根据训练数据的模式生成看似合理的回答。由于许多用户对此特点缺乏了解，这些模型往往将准确与不准确信息混杂在一起，从而破坏了信息的完整性。 此外，数字化平台和生成式人工智能是传播虚假和误导性信息的绝佳组合，因为大多数数字化平台的算法优先考虑内容的用户互动性，而非准确度。随着人工智能生成内容的增加，这些内容可能会成为歪曲事实的媒介，进一步加速虚假信息的传播。尽管事实核查技术已有进展，但数字化平台和人工智能算法仍然缺乏可靠的机制定期确认材料的合法性。此外，不同平台和辖区的事实核查程序存在差异。这意味着即便发现了不准确的内容，也可能需要数小时乃至数天才能修正。 如果继续以目前的方式核查数字化材料，错误信息和虚假信息的传播可能愈演愈烈，从而引发更多关于真实性、偏见、信息隐私等方面的担忧。传播错误信息和虚假信息也会危及民主制度和基本人权。 《世界人权宣言》第十九条规定，“人人有权享有主张和发表意见的自由”，但这种自由绝不能被滥用或扭曲，伤及他人或社区。然而，人工智能生成的内容越来越多地用于传播仇恨言论、仇外心理以及歧视性言论，目标受众往往是难民、少数族裔等弱势民众。2019年，总部位于阿姆斯特丹的网络安全公司Deeptrace开展了一项研究，结果显示96%的深度换脸视频均为非自愿，并且包含色情内容。此外，人工智能生成内容还可能沦为人口贩运的帮凶，诱骗受害者落入剥削的深渊，尤其是妇女和儿童。 技术方面也存在严峻的人权挑战。人工智能学习算法主要依赖从各大数字和社交媒体平台收集来的大量数据，而这些数据通常是由人类上传或通过人类互动生成的。由于数据量巨大，几乎不可能彻查乃至浏览每条信息。人工智能模型利用这些数据识别趋势、生成预测并合成内容，但智能模型评估数据的细腻度远不及人类。这可能导致有害的偏见和错误信息的传播，进而侵犯人权。 随着社会越来越依赖数字化平台和服务，解决这些问题，特别是与人权相关的问题，变得越来越紧迫。 从技术角度来看，为了使人工智能生成的内容准确可靠，开发人员应该在一开始就做好详尽的测试，以便在开发阶段发现偏见、错误和漏洞。数据、算法和决策的透明度对于建立信任和消除人工智能对信息完整性的负面影响至关重要，因为使用多样化的数据集有助于避免有害的偏见，生成更加客观公正的内容。正如《联合国信息完整性全球原则》的建议，技术公司应授权用户就信任和安全、隐私政策和数据使用等各个方面提供意见和反馈，承认用户的隐私权，同时也应该改善用户选择与控制，提高与不同供应商的一系列服务的兼容性。 在人权方面，司法当局和人权组织应该在尊重个人隐私和尊严的同时积极支持人工智能的发展和应用。作为上述倡议的一部分，应该执行更强有力的数据保护法规，保护人们免受冒犯性的数据收集，并阻止人工智能系统未经许可使用个人数据。人权监督机构必须将人工智能伦理纳入现有的人权框架，确保人工智能的应用尊重个人隐私、言论自由和不歧视等个人权利。 数字化平台的所有者应该对共享的内容负责，特别是在人工智能放大虚假信息的背景下，应该开发更先进的内容监控系统，快速识别、删除或标记人工智能生成的错误信息。数字化平台还可以通过进一步公开算法和数据收集方法，确保人们了解平台是如何选择和推广内容的。 资料来源：联合国

正因如此，对于那些希望以符合伦理且遵守法律要求的方式开发人工智能应用的企业、研究机构及公共机构而言，Apertus被赋予了极其特别的意义。对此，施拉格解释道：“通过这款模型，我们成功地向公众示范了如何在不侵犯他人知识产权的情况下以负责任的方式训练生成式人工智能。”

Apertus支持的语言超过1800种：误导性观点

人工智能开发者们付出了巨大努力，训练Apertus掌握了多种语言。据称，该模型支持的语言超过1800种，其中包括各类少数族群的语言以及常被主流大型语言模型忽略的各种方言，譬如列托罗曼语(瑞士另一种国家语言)和瑞士德语(方言)。正因为大多数人工智能模型将侧重点放在使用更为广泛的语言上，Apertus的这一变革型突破便显得尤为可贵。

然而，我们并不能轻易地在识别一门语言与准确使用这门语言之间划上等号。尤其在那些并不常见的习语方面，Apertus可能会犯下重大的错误。

这一点在我们的测试中得到了验证。有时，Apertus会用意大利语生成笨拙或错误的语句。而在使用列托罗曼语翻译祖父一词时，该人工智能模型也表现出了明显的失误。

作为Apertus的开发负责人，施拉格承认道，该人工智能模型的对话能力仍有待提高。然而，该专家也同时强调，根据最新的技术报告，在执行某些指令时，譬如在将德语译成列托罗曼语时，Apertus的表现已超越了其它语言模型。

这一优势并未获得所有人的赞赏。瑞士初创公司Giotto.ai的首席执行官阿尔多·波德斯塔(Aldo Podestà)对此提出了质疑：“如果一款人工智能模型的平均性能表现远远逊色于其它同类模型，更达不到顶级模型的高度，那么，精准掌握列托罗曼语的意义又在哪里呢？”尽管这家初创公司对Apertus项目表示支持，但同时也指出了该人工智能模型的局限性。

作为洛桑联邦理工学院全球健康与人道主义援助智能技术实验室的负责人，玛丽-安妮·哈特利(Mary-Anne Hartley)教授在Apertus语言模型议题上持有不同的观点：“使用小众语言的人群亦有在技术领域中获得一席之地的权利，而这也正是Apertus眼下努力的方向。”事实上，那些局限与不足不过只是一时的障碍，而打造一款更具包容性和更符合伦理规范的人工智能模型才是Apertus开发团队的终极目标。

Apertus仅为瑞士开发：非事实

尽管Apertus由瑞士科研机构在瑞士境内开发完成，但它绝非一款仅适用于瑞士本土应用程序的人工智能模型。需强调的是，用于训练Apertus的大部分数据集取自国际性数据来源，但其中并不包括德语与列托罗曼语数据以及那些与瑞士整体价值体系相关的内容。这些内容明确规定了人工智能必须遵循的一系列原则，譬如中立原则和语言多元化原则。伊马诺尔·施拉格补充道：“除此之外，我们的模型并未涵盖任何特别的瑞士元素。”

与此同时，Apertus的开发团队还期待其他国家也对这一人工智能项目产生兴趣，并为这一项目的后续发展提供相应的基础设施、科研人才以及各项资源。对此，瑞士国家超级计算中心的朱弗雷达表示：“我们的目标是在欧洲乃至全球范围内持续开发Apertus人工智能模型并扩大其影响力。”

由于未连接到互联网，Apertus无法进行实时更新：误导性观点

目前，所有大型语言模型都不具备实时更新的功能。在训练阶段结束之后，这些人工智能模型均将保持静止状态。哪怕在它们被集成到ChatGPT这类能够访问互联网的产品中时，情况也不会发生变化。要想对一款人工智能模型进行修改与更正，唯一的途径便是重新对其实施训练。然而，由于这一操作产生的成本过高，只有那些资源雄厚的企业才有机会频繁更新它们的模型。施拉格解释道：“这是目前人工智能技术领域的一大短板。”

眼下，Apertus开发团队将借助两千万瑞郎的联邦拨款和瑞士Alps超级计算机来筹备下一轮的模型训练。Alps超级计算机完全由水电供能，可在人工智能开发的过程中节省大量的资源。然而，从长远来看，新的资金来源不可或缺。施拉格表示：“我衷心希望Apertus可以尽快迎来更多的投资。要知道，这项技术的发展对我们的数字主权至关重要。”

(编辑：Gabe Bullard，编译自意大利文：Aikens Jun/xy)

