Audio AI Itọsọna

NVIDIA Riva ati NeMo Ọrọ

NVIDIA Riva jẹ SDK isare GPU fun iṣelọpọ ọrọ AI (ASR, TTS, ati itumọ), lakoko ti NeMo jẹ ohun elo irinṣẹ orisun-ìmọ fun ikẹkọ ati ṣiṣe atunṣe awọn awoṣe ti o wa labẹ.

Akopọ

NVIDIA Riva jẹ SDK isare GPU fun iṣelọpọ ọrọ AI (ASR, TTS, ati itumọ), lakoko ti NeMo jẹ ohun elo irinṣẹ orisun-ìmọ fun ikẹkọ ati ṣiṣe atunṣe awọn awoṣe ti o wa labẹ. Papọ wọn jẹ ki awọn olupilẹṣẹ kọ yarayara, awọn ohun elo ohun asefara ti o ṣiṣẹ lori ohun elo NVIDIA.

NVIDIA Riva ati Ọrọ NeMo joko ni awọn ṣiṣan iṣẹ ohun-AI ti o yi ọrọ pada, orin, ati ohun fun ibaraẹnisọrọ, iraye si, ati iṣelọpọ media.

Jin Dive

NeMo (Neural Modules) jẹ ipilẹ-orisun PyTorch ti NVIDIA fun kikọ AI ibaraẹnisọrọ. O gbe awọn awoṣe ti a ti kọkọ tẹlẹ fun idanimọ ọrọ aifọwọyi (ASR), ọrọ-si-ọrọ (TTS), ati awọn iṣẹ ṣiṣe ede ti ẹda, ti a ṣeto bi ‘awọn modulu nkankikan’ ti o tun le lo o le ṣe atunṣe daradara lori data tirẹ. Riva jẹ ẹgbẹ imuṣiṣẹ: o ṣe akopọ awọn awoṣe iṣapeye lẹhin olupin gRPC ṣiṣanwọle, ni lilo TensorRT ati Triton Inference Server lati kọlu lairi kekere ni iwọn. Ṣiṣan iṣan-iṣẹ aṣoju kan ṣe ikẹkọ tabi ṣe adaṣe awoṣe kan ni NeMo, gbejade lọ si ọna kika Riva, lẹhinna ṣe iranṣẹ fun transcription akoko gidi tabi iṣelọpọ. Riva ṣe atilẹyin idanimọ ṣiṣanwọle pẹlu awọn ami akoko ipele-ọrọ, awọn ohun TTS neural, diarization agbọrọsọ, ati ọpọlọpọ awọn ede, gbogbo aifwy lati ṣiṣẹ daradara lori NVIDIA GPUs.

Imọ-imọ-ẹrọ

Iyara Riva wa lati ikojọpọ awọn awoṣe pẹlu TensorRT ati sìn wọn nipasẹ Triton, eyiti o dapọ awọn kernels, kan deede-konge (FP16/INT8), ati awọn ipele awọn ibeere nigbakanna ni agbara. Awọn awoṣe ASR bii Conformer-CTC tabi Parakeet ṣiṣan ṣiṣan ni awọn ṣoki kekere lakoko ti o n ṣetọju ọrọ-ọrọ, ṣiṣe awọn iwe afọwọkọ apakan laarin awọn mewa ti milliseconds. Awọn pipeline TTS so awoṣe akositiki pọ (fun apẹẹrẹ, FastPitch) pẹlu vocoder nkankikan (fun apẹẹrẹ, HiFi-GAN) lati ṣe agbekalẹ awọn igbi ni iyara ju akoko gidi lọ lori GPU kan.

Titunto si NVIDIA Riva ati Ọrọ NeMo

NVIDIA Riva jẹ SDK isare GPU fun iṣelọpọ ọrọ AI (ASR, TTS, ati itumọ), lakoko ti NeMo jẹ ohun elo irinṣẹ orisun-ìmọ fun ikẹkọ ati ṣiṣe atunṣe awọn awoṣe ti o wa labẹ. Papọ wọn jẹ ki awọn olupilẹṣẹ kọ yarayara, awọn ohun elo ohun asefara ti o ṣiṣẹ lori ohun elo NVIDIA. NVIDIA Riva ati Ọrọ NeMo joko ni awọn ṣiṣan iṣẹ ohun-AI ti o yi ọrọ pada, orin, ati ohun fun ibaraẹnisọrọ, iraye si, ati iṣelọpọ media. Lati kọ oye ti o jinlẹ, tọju NVIDIA Riva ati Ọrọ NeMo bi awoṣe iṣẹ, kii ṣe ẹya ẹyọkan: ṣalaye awọn abajade ti o fẹ, ṣalaye awọn arosọ, ati yapa ohun ti eto le ṣe ni igbẹkẹle lati ohun ti o tun nilo idajọ amoye.

Ni iṣe, awọn ẹgbẹ ti o lagbara ni lilo NVIDIA Riva ati NeMo Ọrọ itọju didara, lairi, ati ifọkansi bi awọn ẹya pataki kanna ti ilana imuṣiṣẹ. Wọn ṣe akọsilẹ awọn ibeere aṣeyọri ti o fojuhan, idanwo lodi si data ojulowo ati ṣiṣan iṣẹ, ati atunbere ti o da lori awọn ilana ikuna ti a ṣakiyesi dipo awọn bori ala-akoko kan. Eyi ni ibiti oye imọ-jinlẹ yipada si agbara ti o tọ kọja ọja, eto imulo, ati awọn iṣẹ ṣiṣe.

O ṣe ilọsiwaju iraye si nipasẹ transcription, alaye, ati awọn atọkun ohun. Ni akoko kanna, ilokulo ohun ati awọn eewu imisi eniyan n pọ si nigbati igbanilaaye ba sonu. Ọna resilient julọ julọ ni lati darapọ iyara idanwo pẹlu ibawi ijọba: ṣiṣe awọn awakọ awakọ, mu ẹri mu, ṣe atẹjade awọn iwe ipinnu, ati imudojuiwọn awọn aabo nigbagbogbo bi ihuwasi awoṣe, awọn ireti olumulo, ati awọn ibeere ilana ti dagbasoke.

Ipa Ilana

O ṣe ilọsiwaju iraye si nipasẹ transcription, alaye, ati awọn atọkun ohun.

O ṣe ilọsiwaju iraye si nipasẹ transcription, alaye, ati awọn atọkun ohun. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Awọn ẹgbẹ Media le firanṣẹ ohun didan yiyara pẹlu awọn isuna-owo kekere.

Awọn ẹgbẹ Media le firanṣẹ ohun didan yiyara pẹlu awọn isuna-owo kekere. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Awọn ọna ṣiṣe ti nkọju si alabara le ṣe ilana awọn ibaraẹnisọrọ sisọ ni iwọn nla.

Awọn ọna ṣiṣe ti nkọju si alabara le ṣe ilana awọn ibaraẹnisọrọ sisọ ni iwọn nla. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Ọjọ iwaju ti NVIDIA Riva ati Ọrọ NeMo

NVIDIA n titari Riva ati NeMo si ọna ti o tobi, awọn awoṣe ọrọ ipilẹ ede pupọ diẹ sii ati isọpọ ti o pọ pẹlu awọn aṣoju orisun LLM fun awọn oluranlọwọ ohun opin-si-opin. Reti isọdi ti o ni oro sii (igbega ọrọ, awọn ohun aṣa lati awọn iṣẹju ti data), agbara ariwo-ayika ti o dara julọ, ati imuṣiṣẹ ti o tan GPU aarin data si awọn ẹrọ eti bi Jetson. Bi NeMo ṣe ndagba lẹgbẹẹ awọn awoṣe ipilẹṣẹ, laini laarin idanimọ ọrọ, itumọ, ati ironu ibaraẹnisọrọ yoo tẹsiwaju lati blur sinu awọn opo gigun ti akoko gidi.

Real-World imuse

Ipilẹṣẹ ile-iṣẹ ipe ni akoko gidi ati oluranlowo laaye ṣe iranlọwọ pe awọn ifori awọn ipe alabara pẹlu awọn akoko akoko ipele-ọrọ

Ṣiṣe awọn ohun TTS ti aṣa ti aṣa fun oluranlọwọ foju nipasẹ ṣiṣe atunṣe-daradara FastPitch ni NeMo lori awọn wakati diẹ ti awọn gbigbasilẹ

Ifilelẹ ifiwe ati itumọ ọrọ fun apejọ fidio tabi awọn iṣẹlẹ ṣiṣanwọle lori NVIDIA GPUs

Ṣiṣatunṣe didara awoṣe ASR Conformer kan lori iṣoogun kan pato-ašẹ tabi awọn fokabulari ofin nipa lilo NeMo, lẹhinna ṣiṣẹsin nipasẹ Riva

Awọn Ilana imuse

NVIDIA Riva ati NeMo Ọrọ ni iṣe

Ipilẹṣẹ ile-iṣẹ ipe ni akoko gidi ati oluranlowo laaye ṣe iranlọwọ pe awọn ifori awọn ipe alabara pẹlu awọn akoko akoko ipele-ọrọ.

Ipilẹṣẹ ile-iṣẹ ipe ni akoko gidi ati oluranlowo laaye ṣe iranlọwọ pe awọn ifori awọn ipe alabara pẹlu awọn akoko akoko ipele-ọrọ Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodiwọn didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe lori akoko.

NVIDIA Riva ati NeMo Ọrọ ni iṣe

Ilé aṣa iyasọtọ awọn ohun TTS fun oluranlọwọ foju nipasẹ ṣiṣe atunṣe-daradara FastPitch ni NeMo lori awọn wakati diẹ ti awọn gbigbasilẹ.

Ilé aṣa iyasọtọ awọn ohun TTS ti aṣa fun oluranlọwọ foju nipasẹ yiyi FastPitch ti o dara ni NeMo lori awọn wakati diẹ ti awọn gbigbasilẹ Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe ni akoko pupọ.

NVIDIA Riva ati NeMo Ọrọ ni iṣe

Ifilelẹ ifiwe ati itumọ ọrọ fun apejọ fidio tabi awọn iṣẹlẹ ṣiṣanwọle lori NVIDIA GPUs.

Ifilelẹ ifiwe ati itumọ ọrọ fun apejọ fidio tabi awọn iṣẹlẹ ṣiṣanwọle lori NVIDIA GPUs Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.

NVIDIA Riva ati NeMo Ọrọ ni iṣe

Titun-tunse awoṣe ASR Conformer kan lori iṣoogun kan pato-ašẹ tabi awọn fokabulari ofin nipa lilo NeMo, lẹhinna ṣiṣẹsin nipasẹ Riva.

Titun-tunse awoṣe ASR Conformer kan lori iṣoogun kan pato-ašẹ tabi awọn fokabulari ofin nipa lilo NeMo, lẹhinna ṣiṣẹ nipasẹ Awọn ẹgbẹ Riva nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe lori akoko.

Awọn ewu & Awọn ọna iṣọ

!

ilokulo ohun ati awọn ewu afarawe ṣe pọ si nigbati igbanilaaye ba sonu.

!

Yiye le ju silẹ kọja awọn asẹnti, awọn ede-ede, tabi awọn agbegbe alariwo.

!

Ohun afetigbọ sintetiki le jẹ aṣiṣe fun ọrọ ododo laisi isamisi to yege.

Ilana Ilana imuse

1

Gba ifọkansi ti o fojuhan fun gbigba ohun, ti ẹda, ati ilotunlo.

Gba ifọkansi ti o fojuhan fun gbigba ohun, ti ẹda, ati ilotunlo. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

2

Didara idanwo kọja awọn agbohunsoke oniruuru ati awọn ipo abẹlẹ.

Didara idanwo kọja awọn agbohunsoke oniruuru ati awọn ipo abẹlẹ. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

3

Ṣetumo nigbati eniyan gbọdọ ṣe atunyẹwo tabi fọwọsi awọn abajade.

Ṣetumo nigbati eniyan gbọdọ ṣe atunyẹwo tabi fọwọsi awọn abajade. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

4

Aami ohun sintetiki ki o tọju awọn igbasilẹ provenance fun iṣiro.

Aami ohun sintetiki ki o tọju awọn igbasilẹ provenance fun iṣiro. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

Tesiwaju Ṣiṣawari