Pregled Microsoft Azure: vrhunska obdelava glasu

Microsoft Azure Govor v besedilo je ena najnaprednejših platform za prepoznavanje glasu. Kot del Microsoftove ponudbe Cognitive Speech Services uporablja algoritme globokega učenja za premagovanje slabe kakovosti zvoka in se lahko prilagodi različnim slogom govora za natančno prepisovanje zvoka. V tem pregledu govora v besedilo v programu Microsoft Azure bomo podrobno pregledali to storitev.

Omeniti velja, da Microsoft Azure Speech to Text ni tradicionalni del uporabniku prijazne programske opreme za narekovanje. Namesto tega gre za platformo, usmerjeno k razvijalcem, namenjeno podjetjem pri ustvarjanju, testiranju in upravljanju lastnih izdelkov. Če želite samo prepisati serijo zvočnih datotek, so morda boljša možnost nadomestne aplikacije za pretvorbo govora v besedilo. Za najboljše možnosti si oglejte naš najboljši vodnik po programski opremi za pretvorbo besedila v besedilo.

Govor v besedilo Microsoft Azure: načrti in cene

Z uporabo programa Microsoft Azure Speech to Text lahko brezplačno prepišete do pet ur zvoka in ustvarite en glasovni model po meri na mesec. Vendar je pri brezplačnem paketu naenkrat na voljo samo ena hkratna zvočna zahteva, kar pomeni, da ta možnost za večino podjetij ni izvedljiva.

Obračun za govorno storitev Azure je razdeljen na korake po eno sekundo.

Če želite prepisati več govornih posnetkov hkrati, boste morali nadgraditi na standardni sistem določanja cen Azure. To stane 1 USD na uro zvoka in podpira do 20 hkratnih zahtev. Če želite uporabiti zvočni model po meri ali prepisati večkanalne zvočne datoteke, so potrebni dodatni stroški. Te dodatne storitve stanejo 1,40 USD in 2,10 USD na zvočno uro.

Čeprav Microsoft navaja svoje cene v obliki "na zvočno uro", kot je to v panogi, je obračun dejansko razdeljen na enosekundne korake, tako da ne boste plačali več časa obdelave, kot je zahtevano.

Govor v besedilo Microsoft Azure: funkcije

Ključna funkcija govora v besedilo Azure je dostop do Microsoftovega zmogljivega sistema za obdelavo naravnih jezikov. V zadnjih nekaj letih je Microsoftov govor AI dosegel več pomembnih mejnikov. To pomeni, da lahko zdaj opravlja naloge, ki jih prej storitev za prepoznavanje govora ni mogla, na primer natančno prepisovanje navzkrižnega pogovora med pogovori v manjših skupinah.

Storitev Microsoft Azure za govor v besedilo se lahko integrira s sistemom Office 365 za optimalno natančnost.

Azure deluje z več deset jeziki in narečji in ga je mogoče usposobiti - z uporabo modelov za prepoznavanje govora po meri -, da se bolje prilagodi uporabnikovemu govornemu slogu, hrupu v okolju in besedišču. Če je vaša organizacija že predana Microsoftovemu ekosistemu izdelkov, lahko uporabite podatke iz storitve Office 365, da izboljšate natančnost prepoznavanja govora za izraze, specifične za organizacijo. In kar je najpomembneje, to lahko storite brez ogrožanja varnosti podatkov, saj se možnost Govor v besedilo lahko izvaja lokalno.

Govor v besedilo Microsoft Azure: namestitev

Microsoft Azure je bil zasnovan za razvijalce in ne za potrošnike. To pomeni, da je njegova postavitev zapleten in nekoliko zahteven postopek, ki ga je najbolje prepustiti nekomu, ki ima veliko tehničnega znanja.

Nastavitev Azure ni ravno enostavna, razen če imate izkušnje s programiranjem.

Najhitrejši način konfiguriranja Azure je uporaba Azure Speech SDK v programskem jeziku, kot sta Java ali C ++. Za to se boste morali registrirati za brezplačni račun Azure in v svojem razvojnem okolju ustvariti prazen projekt. Nato boste morali uporabiti Microsoft Visual Studio in napisati kratek program za inicializacijo Microsoftovega predmeta SpeechRecognizer.

Govor v besedilo Microsoft Azure: vmesnik

Tako kot druge platforme za množično prepisovanje naj bi tudi Microsoft Azure Speech to Text deloval kot vmesnik za programiranje aplikacij (API), dodan v programe Office 365 ali integriran v nove platforme in storitve. Zaradi tega ni nobenega vmesnika Azure Speech to Text. Kaj bo videl končni uporabnik, je odvisno od tega, kako je bil integriran Azure Speech to Text.

Spletni portal Azure je intuitiven in enostaven za uporabo.

Medtem bo razvijalec, ki upravlja Azure, to storil prek Microsoftovega spletnega portala Azure, ki se počuti moderno in je enostaven za krmarjenje. Le nekaj minut poišče stran z viri govornih storitev, in ko je primerek dodan v vaš račun, si lahko ogledate opozorila in uporabo v enem oknu.

Govor v besedilo Microsoft Azure: uspešnost

V okviru našega pregleda govora v besedilo Microsoft Azure smo želeli videti, kako se je ta platforma spoprijela z izzivom obdelave surovih glasovnih posnetkov, zato smo, ko je bil naš račun Azure pripravljen za uporabo, naložili vrsto posnetkov z različnimi stopnjami hrupa v ozadju. . Vseskozi je Azure dobro obdelal naše vzorce, saj smo med ocenjevanjem opazili le nekaj napak.

Omogočanje Azurejevega govornega modela po meri je izboljšalo natančnost prepisa.

Azure se je sicer rahlo spopadal pri obdelavi neobičajnih ali posebnih fraz, kot so imena športnih ekip in znanstveni izrazi, vendar je bilo to hitro rešeno z omogočanjem možnosti izhoda po meri. Ko smo aktivirali to možnost, se je Azure lahko prilagodil edinstvenemu besednjaku in slogu govora, ki smo ga uporabljali.

Govor v besedilo Microsoft Azure: podpora

Če želite izvedeti, kako lahko z različnimi programskimi jeziki komunicirate s paketom SDK za storitve govora Azure in funkcije Azure za govor v besedilo vključite v svojo platformo, boste zagotovo potrebovali pomoč. Na srečo je Microsoft ustvaril obsežen katalog gradiv za usposabljanje za platformo Azure, v katerem boste našli primere kode in priročne nasvete.

Oddelek za usposabljanje na spletnem mestu Azure vsebuje veliko koristnih virov.

Vse stranke Azure dobijo tudi brezplačno podporo za obračunavanje in upravljanje naročnin, do katere je mogoče dostopati prek sistema vstopnic. Za večkratno plačilo lahko na svoj račun dodate bolj poglobljeno podporo, ki se začne pri 29 USD na mesec.

Govor v besedilo Microsoft Azure: končna sodba

Platforma Azure za govor v besedilo uporablja najsodobnejšo tehnologijo za zagotavljanje skoraj popolne storitve prepisa. Najbolj primeren je za podjetja, ki so že investirala v ekosistem Microsoft Office 365, ker je mogoče iz vašega obstoječega arhiva dokumentov varno ustvariti modele glasu in besedišča po meri. Nekatera mala podjetja se lahko borijo z Azurejem, saj je za njegovo pravilno nastavitev potrebna pozornost usposobljenega Microsoftovega razvijalca oblakov.

Tekmovanje

Amazon Transcribe, Google Cloud Speech to Text in Watson Speech to Text so neposredni konkurenti Microsofta Azure. Vse te tri platforme lahko tudi natančno izvajajo obsežne serijske prepise. Google Cloud je edini tesen konkurent, ki lahko deluje z več jeziki kot Azure, vendar je dražji, saj ima začetno stopnjo le 0,006 USD na 15 sekund v primerjavi z 0,017 USD na minuto (0,00425 USD na 15 sekund).

Če želite poiskati druge možnosti za Microsoft Azure Govor v besedilo, si oglejte naš najboljši vodnik po programski opremi za pretvorbo govora v besedilo.

Zanimive Članki...