Pregled Google Voice Typing

Kazalo:

Anonim

Vse pogostejša je uporaba glasu za nadzor naših domov in računalnikov. Če se je še pred desetletjem prosilo Alexa ali Google Home, naj nadzirajo luči ali naročijo izdelek prek interneta, se je morda zdelo nenavadno, zdaj pa je to običajno.

Eno od podjetij, ki je največ vložilo v to vrsto tehnologije, je Google, ki svojim napravam Google Home in sistemom Android omogoča sprejemanje ustnih ukazov in celo prepoznavanje zvočnika.

Danes bomo preučili, kako so to tehnologijo povezali s svojo platformo Google Docs, in razmislili, ali je to izvedljiva alternativa drugim komercialnim rešitvam za pretvorbo govora v besedilo.

Cenitev

Programska oprema je vključena v Google Dokumente in je po naravi brezplačna. Za njegovo uporabo potrebujete le Google Račun in mobilno napravo ali računalnik z mikrofonom. To je še en vir podatkov, s katerim lahko Google nabira, vendar je to danes del cene "brezplačno".

Oblikovanje

Glas je mogoče uporabiti za vnos v Google Dokumentih, funkcija se imenuje ‘Voice Typing’ in jo najdete v meniju Orodja v Google Doc ali v Google Diapozitivih. Prav tako ga je mogoče aktivirati na katerem koli mestu s pomočjo bližnjične tipke Ctrl-Shift-S.

Ko ste ga prvič aktivirali, morate za docs.google.com sankcionirati dostop do mikrofona.

Ko sprejmete, da se prikaže majhno okence z logotipom mikrofona, ki ga lahko kliknete, da aktivirate glasovni vnos. Ta se nato nadomesti z rdečim simbolom mikrofona poleg dokumenta, ki označuje, da je sistem v načinu poslušanja.

Preden aktivirate glasovno tipkanje na nadzorni plošči, lahko v meniju izberete jezik in ker je to Google, obstaja veliko možnosti. Lahko pa tudi kliknete na vprašaj in dobite pomoč o uporabi sistema.

Ko gre za te sisteme, je to zelo zgoščena rešitev.

Google bo karkoli povedal, kar rečete, in če sistem ni natančno prepričan glede besede, jo bo podčrtal v sivi barvi. Nato lahko kliknete na te "sumljive" besede in sistem daste nekatere možnosti.

Lahko pa se hitro premikate po dokumentu in ročno odpravite težave ali postavite kazalko in nanj vnesete Voice Typing.

Če se morate med delom pogovoriti z drugo osebo, lahko prosite Google, naj preneha poslušati, nato pa nadaljuje.

Toda za popolno zmogljivost te rešitve obstaja dolg seznam ukazov, ki si jih je treba zapomniti, ki jih lahko kopirate, prilepite, premikate po dokumentu, vstavljate tabele in nešteto drugih funkcij.

In lahko vstavite ločila, oblikujete dokument in celo vstavite hiperpovezave.

Če pa kar najbolje izkoristite to, predpostavljate, da si lahko zapomnite ukaze ali pa imate odprto pomoč za pomik spomina.

Seznam je hitro na voljo, če preprosto izgovorite „Seznam glasovnih ukazov“.

Jeziki

Če številne rešitve za pretvorbo besedila v besedilo pokrivajo le majhno število jezikov, jih ima Google veliko. Trenutni dokončni seznam je:

Afrikaans, amharščina, arabščina, arabščina (Alžirija), arabščina (Bahrajn), arabščina (Egipt), arabščina (Izrael), arabščina (Jordanija), arabščina (Kuvajt), arabščina (Libanon), arabščina (Maroko), arabščina (Oman) , Arabščina (Palestina), arabščina (Katar), arabščina (Saudova Arabija), arabščina (Tunizija), arabščina (Združeni arabski emirati), armenščina, azerbajdžanščina, bahasa Indonezija, baskovščina, bengalščina (Bangladeš), bengali (Indija), bolgarščina, Katalonščina, kitajščina (poenostavljena), kitajščina (tradicionalna), kitajščina (Hong Kong), hrvaška, češka, danska, nizozemska, angleška (Avstralija), angleška (Kanada), angleška (Gana), angleška (Indija), angleška (irska) , Angleščina (Kenija), angleščina (Nova Zelandija), angleščina (Nigerija), angleščina (Filipini), angleščina (Južna Afrika), angleščina (Tanzanija), angleščina (Združeno kraljestvo), angleščina (ZDA), farsi, filipinski, finski, francoski , Galicijski, gruzijski, nemški, grški, gudžaratski, hebrejski, hindujski, madžarski, islandski, italijanski, italijanski (Italija), italijanski (Švica), japonski, javanski, kannadski, kmerski, korejski, laoški, latvijski, litovski, malajalamski, malezijski n, maratščina, nepalska, norveška, poljska, portugalska (Brazilija), portugalska (Portugalska), romunska, ruska, slovaška, slovenska, srbska, singalska, španska, španska (Argentina), španska (Bolivija), španska (Čile), španska (Kolumbija), špansko (Kostarika), špansko (Ekvador), špansko (El Salvador), špansko (Španija), špansko (ZDA), špansko (Gvatemala), špansko (Honduras), špansko (Latinska Amerika), špansko (Mehika) ), Španščina (Nikaragva), španščina (Panama), španščina (Paragvaj), španščina (Peru), španščina (Portoriko), španščina (Urugvaj), španščina (Venezuela), sudanski, svahili (Kenija), svahili (Tanzanija), Švedsko, tamilsko (Indija), tamilsko (Malezija), tamilsko (Singapur), tamilsko (Šrilanka), tajsko, turško, ukrajinsko, urdu (Indija), urdu (Pakistan), vietnamsko in zulu.

To je 119 jezikov, vključno s 13 arabskimi oblikami, 19 španskimi različicami, 13 angleškimi narečji in celo štirimi okusi tamilščine.

Vključeni so jeziki, ki jih programska oprema za narekovanje redko podpira, na primer Zulu in Islandska, zaradi razmeroma majhnega števila govorcev.

Jezikovna pokritost je verjetno največja prednost Google Voice Typing.

Posnetki

Če ima ta rešitev slabost, je, da posnetkov ne more zlahka obdelati.

Čeprav tega ni nemogoče, vendar je treba popraviti zvočni sistem računalnika, tako da sprejme izhod, namenjen zvočnikom, in ga usmerja, kot da prihaja iz mikrofona. Toda to vam ne omogoča razlikovanja med različnimi ljudmi na posnetkih in lahko vpliva na umetno inteligenco, ki jo Google uporablja za izboljšanje verbalne natančnosti z učenjem, kako govorite.

Če želite prepisati poddaje ali posnete intervjuje, vam priporočamo, da uporabite kaj drugega, saj to orodje ni zgrajeno za ta namen.

Natančnost

Težko je presoditi natančnost sistema za obdelavo glasu, če mu ne morete poslati enakih posnetkov, kot so jih pretvorili drugi izdelki. Vsakdo, ki redno uporablja Alexa ali Google Home, bo vedel, da nas občasno ne bo razumel, predvsem zaradi tujih zvokov ali nedoslednega govora.

Kljub temu je bilo v aktivnem testiranju, ki smo ga izvedli, to orodje večino besed praviloma pravilno ali pa je bila v besedilu hitro sumljiva.

Da bi dosegli najboljše rezultate, potrebujemo nekaj nadzora nad hitrostjo, glasnostjo in tonom govora, kar nedvomno prihaja z vajo. Če si zapomnimo vse posebne ukaze, lahko kritično zmanjšamo količino potrebnih sprememb po snemanju.

Glede na vaša pričakovanja je točnost tukaj sprejemljiva. Njegove interpretacije so dosledne in so se ohranile med našimi testi. Kako dobro vam deluje, ne moremo napovedati. Ker pa je brezplačna, za določitev tega ne bo stalo nič drugega kot vaš čas.

Varnost

Ker gre za Google, je varnostni model isti, ki nadzoruje dostop do vseh Google Računov. To se giblje od preproste zaščite z geslom do bolj razumne do dvofaktorske overitve (TFA).

Glede na število tatov identitete okoli, tisti, ki uporabljajo Google brez TFA, tvegajo ogrožanje svojih računov.

Tudi ta varnostna možnost ima svoje omejitve, vendar je boljša od zgolj gesla.

Za tiste, ki niso dovolj paranoični, toplo priporočamo, da obiščete https://myactivity.google.com/myactivity

Videli boste, kaj Google dnevno zbira pri vas, kar lahko vključuje posnetke vaših glasovnih ukazov.

Končna sodba

To bi lahko bil daljši pregled, če bi ta programska oprema ponujala več funkcij, vendar ne.

Glede na to, da so rešitve za pretvorbo besedila v besedilo, ta ni zapletena, ima pa dovolj funkcionalnosti, da je resnično uporabna.

Zasnovane so tudi druge rešitve za prepisovanje pogovorov med več osebami, pri čemer je bila zasnovana za obravnavo ene same osebe, ki govori nadzorovano in natančno.

Z njegovo uporabo se domneva, da z veseljem uporabljate Google in Google Dokumente, tudi če to ni končni cilj besedila, ki ste ga vnesli.

Kopiranje diktata iz Google Dokumentov v drugo aplikacijo ni potrebno, kopija v oblaku pa se bo sklicevala, če jo boste na koncu potrebovali.

Nekateri uporabniki imajo razumljivo težave s hranjenjem Googlovega nenasitnega apetita po uporabniških podatkih, ta mehanizem pa je še en vir podatkov, ki jih mora prigrizniti.

Če se počutite tako, potem ne boste uporabljali Google Voice Typing ali česar koli drugega s strani Googla.

Za tiste, ki želijo sprejeti, koliko Google morda ve o njih, je rešitev za glasovno narekovanje v Google Dokumentih dovolj za splošno uporabo, še posebej, če to funkcijo potrebujete le občasno.