ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

日本AI新突破!Shisa V2405B开源,日语处理能力超越GPT-4

时间:2025-06-05 09:27:38来源:ITBEAR编辑:快讯团队

近期,日语AI领域迎来了一项重要突破,一家名为Shisa.AI的东京初创公司发布了其最新日英双语模型——Shisa V2405B,这一成果迅速吸引了业界的广泛关注。Shisa.AI专注于为日本市场开发先进的开源AI语言和语音模型,而此次发布的模型更是被誉为日本有史以来训练的最强大型语言模型。

据了解,Shisa V2405B是基于Llama3.1构建的,不仅在日语任务上表现出色,还保留了强大的英语处理能力。测试数据显示,该模型在多项日语基准测试中超越了GPT-4及GPT-4Turbo,与最新的GPT-4o和DeepSeek-V3在日语任务上的表现不相上下。这一突破性进展标志着日本本土AI实验室在全球AI竞争中迈出了重要一步。

Shisa.AI在模型开发过程中,放弃了昂贵的持续预训练和分词器扩展,而是聚焦于优化后训练流程。通过合成数据驱动的方法,他们显著提升了模型性能。其核心数据集ultra-orca-boros-en-ja-v1经过精心处理,被认为是目前最强大的日英双语数据集之一。这一数据集已在Apache2.0许可证下免费开放,为全球开发者提供了宝贵的资源。

Shisa V2系列模型涵盖了从7B到405B参数的不同规模,满足多样化需求。在日语语法、角色扮演、翻译等任务上,这些模型均表现出色。特别是在shisa-jp-ifeval(日语指令遵循测试)、shisa-jp-rp-bench(日语角色扮演基准)和shisa-jp-tl-bench(日英翻译基准)等测试中,Shisa V2系列模型均优于各自的基础模型。Shisa V2405B在训练中融入了少量韩语和繁体中文数据,进一步增强了其多语言能力。

Shisa.AI的开源精神不仅推动了日语AI的发展,还为全球AI社区带来了积极影响。他们公开了Shisa V2系列的训练日志,训练过程使用了AWS Sagemaker的4节点H100集群,并结合了Axolotl、DeepSpeed和Liger Kernel等先进技术。Shisa.AI还计划开源其日语专用基准测试工具,助力日语大型语言模型的研究和评估。

Shisa.AI的成功展示了日本在AI领域的创新实力。对于需要处理复杂日语任务的开发者来说,Shisa V2系列模型无疑是一个强大的工具。随着Shisa.AI不断更新其模型和资源,日本在全球AI领域的竞争力将得到进一步提升。

更多热门内容
益生菌与健康:揭秘肠道健康的真相与迷思
Yushan:所以,对于没有肠道疾病症状的人来说,选择对自己肠道微生物好的饮食和生活方式,是否更多是在图一个心安? 史寒朵:我比较喜欢的比喻是,肠道菌群是一个生态系统,比如热带雨林和干旱草原都可以稳定、多样…

2025-06-06

焦煤价格暴跌近四成,能源转型下的黑色阵痛何时止?
山西作为全国最大焦煤产地,2025年产量目标增长5%,但省内部分低硫煤企因环保限产被迫减产,而高硫煤因下游接受度低面临滞销压力,价格分化加剧。 业内最为关心的价格,综合供需变化与政策调控,我们预计下半年焦煤价…

2025-06-06

盛夏爆品全域热销,快手磁力引擎“清凉一夏焕新计划”引爆消暑经济
炎炎夏日,热浪来袭,催熟消暑市场。日前,快手磁力引擎大快消业务中心打造的“清凉一夏焕新计划”圆满落下帷幕。此次活动针对消费者夏日焕新、消暑需求,以多元政策及活动玩法推动品牌商家抓住盛夏节点机遇实现销量爆发。活动期间,快手磁力引擎大快消业务针对夏日好物

2025-06-06

可灵AI与《逆水寒》手游达成深度合作 AI技术赋能游戏内容创新
近日,全球领先的视觉生成大模型可灵AI与热门手游《逆水寒》达成深度合作,将业内领先的AI视频生成能力内置于游戏中,让玩家可在静态图片到动态视频的高效转化,不仅丰富了游戏的社交玩法,也为可灵AI在游戏领域开辟了新的商业化路径。《逆水寒》手游一直积极探索AI技术

2025-06-06