Watsoni kõne teksti ülevaade: parim mahukas transkriptsiooniteenus?

Lang L: none (table-of-contents):

Anonim

Watson on IBM-i loomulikku keelt töötlev arvutisüsteem. See toidab nii kuulsatele küsimustele vastavat superarvutit kui ka mitmeid tehisintellektil põhinevaid ettevõtte tooteid, sealhulgas Watsoni kõnet tekstiks. Watsoni kõnes tekstiks ülevaates vaatleme ühte parimat kõnepost-tekstirakendust, mis sobib ideaalselt kõigile, kes soovivad heli ulatuslikuks tekstiks teisendada.

Watsoni kõnetöötlusplatvorm on saadaval IBM Cloudis. See on mitmekülgne tööriist ja seda saab kasutada paljudes kontekstides, sealhulgas dikteerimisel ja konverentskõne transkriptsioonil. Veelgi enam, erinevalt enamikust teistest kõnes-tekstis-rakendustest on see saadaval API-na, mis võimaldab arendajatel seda muu hulgas manustada ka hääljuhtimissüsteemidesse.

Watsoni kõne tekstiks: plaanid ja hinnakujundus

Watsoni kõne tekstiks saate kasutada kuni 500 minutilise heli tasuta töötlemiseks kuus. Kui soovite teisendada rohkem kui seda, peate maksma iga heliminuti eest ja kiirus muutub töödeldud heli kestuse põhjal. Kulud jäävad vahemikku 0,01–0,02 dollarit minutis ja lisatasu on 0,03 dollarit minutis, kui vajate IBMi kohandatud keelemudelit. Saadaval on ka ainult hinnapakkumisi pakkuvad Watsoni paketid, mis võimaldavad juurdepääsu andmete privaatsuse täiustatud funktsioonidele ja uptime-garantiidele.

Watsoni kõnes tekstiks teenuse hind sõltub transkribeerimiseks vajaliku sisu mahust.

Watsoni kõneteksti süsteemile pääseb juurde ka üldotstarbelise IBM Cloudi tellimuse kaudu. Loomuliku keele töötlemine on vaid üks rakendus paljudes tehisintellekti teenustes, mida saate IBM Cloudi kaudu saada, seega on see hea võimalus kõigile organisatsioonidele, kes vajavad juurdepääsu kiiretele andmeedastustele, vestlusrobotitele või teksti kõneks tööriistadele.

Watsoni kõne tekstiks: funktsioonid

Tänu paindlikule API-integreerimisele ja teistele IBM-i eelsetele tööriistadele läheb Watsoni kõnetuvastusteenus kaugemale põhilisest transkriptsioonist. Kui soovite seda kasutada näiteks klienditeeninduse kontekstis, saab Watsoni assistendi seadistada loomuliku keele küsimusi otse töötlema või küsimustele telefoni teel vastama.

Watsonis on IBM kokku pannud funktsiooniderikka loomuliku keele töötlemise platvormi.

Watson töötab elava heliga 11 keeles ja saab helisid importida mitmesugustes eelsalvestatud vormingutes. Voogesituse ajal tähendab reaalajas diagnostika tugi, et Watson võib paluda kasutajatel oma mikrofonile lähemale minna või oma keskkonda muuta. Muljetavaldav on ka asjaolu, et Watson saab tänu kõnelejate diarizatsioonile, mis on endiselt beetatestimise funktsioon, jagada jagatud vestluses erinevaid kõlareid.

Watsoni kõne tekstiks: seadistamine

Watsoni kasutamiseks peate kõigepealt looma IBM Bluemixi konto. Registreerimine on tasuta ja valutu ning nõuab vaid e-posti aadressi ja parooli. Pärast sisselogimist peate lisama oma kontole teenuse Kõne tekstiks säte. Selles etapis antakse teile paar volikirja, mille peaksite oma dokumentidesse salvestama.

Watsoni täieliku funktsioonikomplekti juurde pääsemiseks on vajalik IBM Bluemixi konto registreerimine.

Pärast selle tegemist muutuvad asjad oluliselt keerukamaks. Watsonile juurdepääsemiseks peate lisama need mandaadid kliendi ühtse ressursilokaatori (cURL) partiisse ja seejärel käivitama selle oma arvutis. Selleks, et täpselt teada saada, millist käsku helistada, vaadake seda käepärast juhendit. Teise võimalusena, kui soovite lihtsalt näha, kui hästi Watsoni süsteem töötab, ilma et peaksite kõik need rõngad läbi hüppama, võite seda proovida hoopis IBMi demosaidil.

Watsoni kõne tekstiks: liides

Erinevalt tarbijale suunatud kõnetekstirakendustest on Watsoni teenused loodud juurdepääsuks API-de ja teistesse süsteemidesse manustatud koodi kaudu. Sel põhjusel pole Watsoni tegelikku „liidest”. Selle asemel pääseb Watsonile juurde kolme erineva Interneti-protokolli kaudu. Need on WebSockets, REST API ja Watson Developer Cloud.

Watsoni kõnet tekstiks saab hallata Watsoni arendaja pilvesüsteemi kaudu.

Watsoni juhtimiseks peate kasutama käsurea tööriista, mis ühendub IBMi pilvega ühe neist kolmest marsruudist. Kasutajaliidese, mida Watsoniga suhtlev lõppkasutaja näeb, peab keegi teie arendustiimis eraldi üles ehitama.

Watsoni kõne tekstiks: esitus

Üldiselt avaldas meile muljet viis, kuidas see loomulikku keelt töötlev platvorm tegeles tõelise kõnega. Kasutasime Watsoni abil mitmesugustes väljakutsuvates keskkondades salvestatud klippe ja mitmetes Watsoni 11-st toetatud keelest peetud kuulsate kõnede helisignaale.

Leidsime, et Watson esines hästi salvestatud kõnega.

Kuigi vead sagenesid suurema taustamüra klippide puhul, andis Watson üldiselt uskumatult täpseid tulemusi. Testide järgi arvasime, et eksimatuid vigu esines keskmiselt ainult üks kord iga 150 sõna kohta. Siiski sai selgeks, miks jääb Watsoni kõlarite diariisimise funktsioon BETA testimisse, kuna mitu korda meie hindamise käigus märgiti üks hääl eraldi kõlaritena.

Watsoni kõne tekstiks: tugi

IBMi ressursikeskus pakub rohkelt dokumente, et paremini mõista, kuidas Watsonit teie konkreetsel kasutusjuhtumil rakendada. Samuti tasub kasutada Watsoni arendajate kogukonna loodud ja GitHubi postitatud API-integreerimisi ja SDK-sid.

Watsoni API GitHubi leht on hea tugiallikas Watsoni kõnes tekstiteenusele.

Kui te ei leia oma probleemile lahendust, võite pöörduda otse IBMi poole, avades tugipileti või võttes temaga telefoni teel ühendust. Niikaua kui olete valinud ühe Watsoni esmaklassilise paketi, on teie Watsoni kasutamine kaitstud teenuse Uptime lepinguga.

Watsoni kõne tekstiks: lõplik kohtuotsus

Kui teie organisatsioonil on oskusteave ja ressursid IBM Watsoni kõne tekstiks platvormi õigesti oma süsteemi integreerimiseks, saate kasu täiustatud funktsioonidest, nagu reaalajas helikeskkonna diagnostika ja ajutiste transkriptsioonitulemuste kasutamine. Kuid väikeettevõtted ja organisatsioonid võitlevad Watsoni nõuetekohase üles seadmise tehnilise väljakutsega.

Võistlus

IBM Watsoni kõne tekstiteenus on hulgitranskriptsiooniteenuste Google Cloud Speech-to-Text ja Amazon Transcribe otsene konkurent. Mõlemad on oluliselt odavamad kui Watson, näiteks Google Cloudi transkriptsioon algab 0,006 dollarist minutis. Kõigil kolmel teenusel on sarnased funktsioonid, näiteks kohandatud sõnavara, kuid üks funktsioon, mis IBM Watsonist väga puudu on, kuid mis on saadaval mõlema konkurendi juures, on automaatne kirjavahemärkide tuvastamine.

Kas otsite teist spoeech-to-text lahendust? Vaadake meie parimat kõnes tekstiks tarkvara juhendit.