"Náš softvér dosiahol rovnocennosť s ľuďmi," pochválil sa Xuedong Huang, šéf výskumu vo firme Microsoft. Nehovorí o nejakých ľudských právach, ale o schopnosti prepisovať bežnú ľudskú konverzáciu do textu, píše český iDnes.
Aktuálne publikovali štúdiu, v ktorej ukazujú, že dosiahli chybovosť 5,9 percenta v štandardnom teste NIST. To sa môže zdať ako vysoká miera chybovosti, ale ľudia pri prepisovaní tej istej konverzácie zvyčajne robia rovnako alebo o trochu viac chýb. Ide totiž o reálne nahrávky telefonických rozhovorov a nie každému slovu je dobre rozumieť.
Hoci ide o symbolicky významný míľnik, kvantitatívne sa nejde o veľký skok. Už minulý mesiac Microsoft dosahoval chybovosť (WER) 6,3 percent. Väčšina tímov, ktoré sa rozpoznávaním reči zaoberajú, v poslednej dobe dosahuje výrazné zlepšenia vďaka pokrokom v strojovom učení.
Programátori, ktorí chcú do svojho softvéru zabudovať funkciu pre rozpoznávanie reči, tak majú z čoho vyberať.
"Pred piatimi rokmi by som si nedokázal predstaviť, že to dosiahneme," uviedol Harry Shum, viceprezident tímu Microsoft Artificial Intelligence and Research Group. "Vôbec by som si vtedy nemyslel, že je to možné."
Vtedy Microsoft dosahoval chybovosť medzi 17 a 27 percentami. Rozpoznanie konverzačnej angličtiny pritom patrí k tým najťažším úlohám, ako ukazuje porovnanie NIST z roku 2009.