Lielākā daļa cilvēku saista amerikāņus ar invaliditātes likumu ar fiziskām, infrastruktūras izmaiņām, kas jāveic ēkās vai citās vietās, taču, paplašinoties invaliditātes definīcijai, cilvēki saprot, ka “pieejams” attiecas arī uz tādām lietām kā tīmekļa vietnes un balss atpazīšana.
Šajā gadījumā tehnoloģiju gigants Google cenšas uzlabot balss atpazīšanas programmatūru, izmantojot projektu Euphonia. Projekts Euphonia ir iniciatīva, lai ierakstītu brīvprātīgo balss paraugus un tos analizētu, lai cilvēki ar ALS, neiroloģiskiem traucējumiem un citām runas grūtībām varētu ērti izmantot savas viedierīces “tipiskam” indivīdam.
Kāpēc es brīvprātīgi pieteicos
Smadzeņu audzēja izraisīta paralizēta kreisā balss saite un asimetriskā mēle ir novedusi pie manas runas slimības Disartrija. Mana neskaidrā runa un vājā balss apgrūtina draugu un ģimenes locekļu sapratni vai dzirdēšanu, it īpaši pārpildītā telpā. Tas mani padarīja par galveno kandidātu projektam Euphonia, tāpēc, tiklīdz par to izlasīju, es pieteicos brīvprātīgajam. Ierakstot paraugus elementārā tīmekļa vietnē, es atkārtoju 4500 frāzes no “Kā nokļūt Mountain View, Kalifornijā?” Līdz “Atskaņot Cardi B dziesmas”.
Papildus projekta Euphonia kritēriju izpildei es piedalījos brīvprātīgajā darbā, jo 1997. gadā pirmo reizi tiku iepazīstināta ar vadošo balss atpazīšanas programmu Dragon Naturally Speaking-un tā iespaidīgi neizdevās. Gadu gaitā esmu izmēģinājis līdzīgas programmas Bostonas Bērnu slimnīcas Palīgtehnoloģiju laboratorijā, kā arī atjauninātas versijas. Pūķis, un, lai gan šī programmatūra ir guvusi lielus panākumus, tā joprojām cenšas precīzi noteikt manu balsi.
Tas ir problemātiski divu iemeslu dēļ: es esmu rakstnieks, kuram trūkst smalko motoriku, tāpēc es rakstu ar vienu roku vai lēnām ar divām, ja esmu noguris. Ar trim paša izdotām dzejoļu grāmatām, memuāriem un nepublicētu saistītu stāstu kolekciju ar manu vārdu es drebēju, domājot, cik daudz vairāk es būtu varējis radīt, ja rakstīšana nebūtu tik fiziski grūts uzdevums.
Otrs iemesls, kādēļ balss atpazīšana man nav līdzvērtīga, ir tas, ka mājās un tālruņos tiek izplatīti produkti ar balsi. Vienkārši izmantojot savu stāstu, ja es varētu piekļūt datoriem un viedierīcēm tā, kā tos paredzēts izmantot, tas man dotu vairāk brīvā laika, ļautu pilnībā izpildīt uzdevumus un, iespējams, pārveidotu manu dzīvesveidu.
Projekts Euphonia: kā tas darbojas?
Tātad, kā darbojas Euphonia? Pēc tam, kad savā tālrunī bija lejupielādējis lietotnes prototipu ar personalizētu runas atpazīšanas modeli, es noliku tālruni pie klēpjdatora un diktēju tajā; To darot, es skatījos, kā viss, ko es teicu, parādās manā Google dokumentā klēpjdatorā. Es to darīju dažus mēnešus, ierakstot frāzes no romāna, kuru es rakstīju, un laboju visas Google neprecizitātes, izmantojot lietotni.
Vēl pēc vairākiem mēnešiem bez frāžu ierakstīšanas, izmantojot lietotni, pabeidzu romāna pirmo uzmetumu - 20 000 vārdu. Tas nenozīmē, ka tas ir nevainojams; par katru rakstīto stundu man jāatgriežas un jāpavada stunda, veicot nelielas korekcijas. Bet man nekas nav pretī, jo Euphonia ir beta stadijā un tā vietā, lai lēni izsistu 100 vārdus dienā, es ģenerēju 500 vārdus dienā.
Tad vēl ir fakts, ka Euphonia nebija paredzēts tekstapstrādei - tas ir vairāk paredzēts deklaratīvām komandām -, un mans rakstīšanas stils ir tas, ko viņi sauc par “bikses” (lido aiz bikses sēdekļa), tāpēc man ir daudz paužu jo es nezinu, kā beigsies teikums - jūs zināt, tāpat kā Maikls Skots. Tomēr, kad es zinu, ko vēlos teikt, piemēram, tekstos, e -pasta ziņojumos vai norādījumos savam palīgam, tā ir līdz šim visprecīzākā runas atpazīšana, ko jebkad esmu izmantojis.
Kad tādas iestādes kā Google dod iespēju invalīdiem veidot nākotnes arhitektūru, ļaujot viņiem palikt pašiem, nevis mēģināt tos pārvērst par kaut ko “normālu”, tas man liek cerēt, ka AI laikmetā humānisms uzvarēs.
Ja vēlaties apmeklēt Project Euphonia vietni vai jums ir runas traucējumi un vēlaties sniegt balss paraugu, varat doties uz šo saiti: https://sites.research.google/euphonia/about/