到达我们 + 44 7456 035580
所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

无监督的方法为低收入资源语言音频分类


联合研讨会在世界峰会上汽车和自治系统和机械和航空航天工程国际会议和展览

2021年9月17日|网络研讨会

不过Joshi

Tribhivan大学、尼泊尔

ScientificTracks抽象:RRJET

文摘

资源缺乏语言可以被理解为研究较少,资源稀缺,那么计算机实际上是那些有相对较少的数据用于训练会话的人工智能系统。音频样本没有音标可以通过互联网以及各种其他来源。今天音频识别和分类系统的主要形式都属于监督学习需要数万小时的音频和手工抄录数据需要为每个语言重复。创建一个无监督模式提取演讲表示会产生潜在的学习无标号数据预示着资源有限的语言,像印地语,泰卢固语,普通话,他加禄语、马来语、尼泊尔和越南。在这项工作中,模型训练使用wav2vec框架由Facebook开发和开源人工智能研究的培训生音频在23种语言。这项工作的重点是局限于尼泊尔语和尼泊尔音频连同几个小时几个小时的无标号的收集与转录音频开发这个模型。同时,新闻语料库与适当的分类也用于训练和分类的录音。结论:这种无监督的方法对录音分类将高度应用程序资源缺乏语言。之一,当前state-of-theart模型自动语音识别已经使用。起初训练的模型与未标记数据更容易执行,尼泊尔的模型可以调整数据集收集转录音频和新闻语料库。 Even though the accuracy of the captions generated with this approach in the present form is not that high but the categorization is done with better accuracies. So, with this approach, even though the user are located at some remote location, but as long as he/she is connected to the Internet, the autonomous vehicle control will voice instructions for Low-Resource Languages.

传记

不过Joshi收到了从大阪Sangyo大学工程学博士,日本在2013年。他做的电子和通信工程学士和硕士科学信息和通信工程研究所的工程(埃克斯波特学院),布汶大学(TU),尼泊尔。目前,他的工作是电子和计算机工程系助理教授,Pulchowk校园,埃克斯波特学院,你。
他还与埃克斯波特学院作为实验室的一员信息通信技术的研究和发展。以前,他曾经协调员工作信息和通信工程硕士学位,高级软件工程师埃克斯波特学院D2Hawkeye LogPoint研究顾问。他还积极参与有价值的研究领域的大数据的机器学习及其应用,特别是图像和演讲。他一直积极发布国内及国际研究论文。他是NEC, NEA、IEEE & AEHIN ISCA演讲。