Google在L10n活动中推出了印度语言的多语言表示形式(MuRIL)?

谷歌揭幕 一种新的基于AI的语言模型 2020年12月17日在其L10n事件中的“ MuRIL”。 用户现在可以 在英语和四种新增的印度语言中的任何一种之间切换搜索结果-泰米尔语,泰卢固语,孟加拉语和马拉地语-在移动设备上。也, 谷歌地图 (Google的导航应用) 现在将支持九种印度语言。
.@partha_p_tGoogle印度的研究科学家,谈到了MuRIL-一种强大的多语言模型,该模型免费,开放源代码,并在TensorFlow HubYOYASIYAYAP╗TANEYAT╗YAYASYOYAP╗TANEYAT╗上提供给所有人
тАФGoogle印度(@GoogleIndia) 2020年12月17日
听到这个 #L10n 直播тЮбя╕П //t.co/wHMPTokz8C pic.twitter.com/I4Nyx0ZRoa
2020年7月,Google宣布通过在未来5-7年内在印度投资100亿美元,以加速印度的数字经济发展 “ Google for India Digitization Fund”。
该投资针对四个关键领域:
1-启用 以他们熟悉的语言为每个印度人提供负担得起的访问和信息-印地语,泰米尔语,旁遮普语,泰卢固语,卡纳达语等
2-建立 满足印第安人独特需求的产品。
3- To 授权业务 随着印度人继续为该国的数字化转型做出努力。
4- To 利用技术和人工智能促进社会公益,例如健康,教育和农业领域。
什么是MuRIL?
印度语言的多语言表示形式(MuRIL) 是个 Google推出的最新多语言模型 并且是 旨在提高从一种语言到另一种语言的互操作性。 根据Google,MuRIL 支持16种印度语言。
MuRIL的特点:
让我们看一下广泛的功能,这些功能将为印度各地数以百万计的人们增强语言体验:
1-轻松切换英语和印度语结果。
用户现在可以 在英语和四种其他印度语言之间切换搜索结果-泰米尔语,泰卢固语,孟加拉语和马拉地语-在移动设备上,使用搜索栏下方的“芯片”或“标签”。
2-了解以英语搜索查询时要显示的语言内容。
根据Google的说法,很难用其母语输入印度语言。结果,许多人使用英语进行搜索,但是更喜欢使用其本地语言的搜索结果。
因此,在接下来的几个月中, 即使本地语言查询以英语键入,搜索也会在适当的情况下以受支持的印度语言显示相关内容。 它会 推出五种印度语言-印地语,孟加拉语,马拉地语,泰米尔语和泰卢固语。
3-使人们能够以他们选择的语言使用应用程序。
根据Google的说法,印度Google Discover上观看的内容中有50%以上是印度语言。此外,在启动用于Google Assistant的Assistant语言选择器后,印度语言的查询量增加了一倍。
现在,印度各地的用户可以使用以下一种 Google地图上的九种印度语言 在设置中点击“应用语言”。这将使用户可以搜索位置,获取路线和导航,并以他们首选的本地语言与地图互动。
4-印地文和英文作业帮助。
Google镜头可以帮助您搜索看到的内容,更快地完成工作,并仅使用相机或照片就能了解周围的世界。现在,用户可以使用 镜头拍摄数学查询的照片并学习如何自行解决, 印地语(或英语)。
5-帮助计算机系统大规模理解印度语言。
随着印度语言的多语言表示形式(MuRIL)的推出, 现在支持音译文本-以前的同类模型中没有此功能。
MuRIL也擅长 确定句子的情感。 For instance, “ Acchha hua account bandh nahi hua” 过去曾被解释为否定声明,但是随着MuRIL的推出,该声明现在将被正确识别为肯定声明。
现在, MuRIL支持英语以及16种印度语言,并且可以从TensorFlow Hub免费下载。 It will 帮助研究人员,学生,初创企业以及对建立印度语言技术感兴趣的任何人。
2020年10月, Google在其发布商政策中添加了新条款 至 停止通过Google不支持的区域性语言将新内容,网页和应用程序货币化 并将生效 从2021年3月开始
资料来源:谷歌