谷歌发布三大Gemma模型：医疗、手语、海豚语言领域迎新突破！-人工智能-ITBear科技资讯

在人工智能领域，谷歌再度迈出了令人瞩目的一步，推出了三款基于Gemma架构的创新模型：MedGemma、SignGemma和DolphinGemma。这些模型分别针对医疗、手语翻译以及海豚语言研究，展现了AI在多元化应用场景下的强大潜力。

首先，MedGemma是谷歌为医疗行业量身打造的AI模型，分为4B多模态版本和27B文字推理版本。4B版本能够处理图像与文本的组合任务，在医疗影像诊断、报告生成等方面表现出色，适用于胸部X光片、皮肤科图像、眼科图像和病理切片等数据的处理。而27B版本则专注于文本处理，拥有强大的推理能力，适用于病历分析、医疗问答等复杂场景。这两款模型均能在单块GPU上高效运行，为医疗开发者提供了灵活多样的选择。

谷歌通过Health AI Developer Foundations计划发布了MedGemma，旨在加速医疗应用的开发进程。未来，开发者将能够利用这些模型构建更加智能的医疗工具，推动精准医疗的发展。

其次，SignGemma是一款专为手语翻译设计的AI模型，重点支持美国手语（ASL）到英语的翻译。这款模型能够将手语动作转化为口语文本，为聋哑患者和开发者提供了一种全新的交互方式。SignGemma在手语理解方面表现出色，被誉为迄今为止最强大的手语理解模型。谷歌计划在未来进一步扩展SignGemma的多语言支持，助力全球聋哑社区实现无障碍沟通。

基于SignGemma，开发者可以开发出实时手语翻译工具、教育平台等创新应用，为聋哑群体带来更多便利。这一模型的推出，无疑将推动手语翻译技术的进一步发展。

最后，DolphinGemma是谷歌与Wild Dolphin Project（WDP）和乔治亚理工学院合作开发的创新模型，旨在分析和生成海豚的复杂声音。这款模型基于40年积累的北大西洋斑点海豚声学数据，能够识别特定声音模式，并预测声音序列。DolphinGemma已集成到WDP的CHAT系统中，通过智能手机界面实现实时海豚声音分析。

研究人员甚至尝试通过合成哨声与海豚进行简单交互，这一成果为跨物种沟通的研究提供了新的思路。谷歌计划于今年夏季将DolphinGemma开源，允许更多研究者将其应用于其他鲸类物种，加速跨物种沟通的研究进程。

这三款模型均基于Gemma架构，兼顾高效性和适应性。然而，Gemma系列的非标准许可条款也引发了一些开发者对商业应用的担忧。未来，谷歌需要进一步优化许可政策，以提升模型的商业化潜力。