Tecnologia Text a veu en un estil espontani, desenvolupat per Xiaomi AI Lab a la Xina, és una de les últimes fronteres pel que fa al reconeixement de veu i l'ús de dispositius a través de la veu. El projecte que nascut dins del laboratori es diu "Posseeix la meva veu“. Permet als destinataris que lamentablement pateixen trastorns de la parla tenir veus úniques i personalitzades per comunicar-se amb altres persones. Vegem amb detall què és i quant de temps fa que l'empresa xinesa hi treballa.
Xiaomi ha presentat la seva darrera aplicació d'algoritmes avançats i tecnologia de veu autodesenvolupada que ajuda les persones amb trastorns de la parla
Xiaomi es preocupa per les persones i s'esforça per satisfer les seves diverses necessitats mitjançant la innovació tecnològica. Durant els últims anys, la marca xinesa ha descobert el desig de molts usuaris amb trastorns de la parla posseeix la teva pròpia veu, fins i tot únic, per ser utilitzat per a la comunicació diària. Per aquest motiu Xiaomi ha establert l'equip del projecte "Posseeix la meva veu“. Zhu Xi, coordinador del Comitè Tecnològic de Tecnologia per al Bé de Xiaomi, va dir:
Estem entusiasmats d'explorar els múltiples valors que ens ofereix la innovació tecnològica, com ara respondre a les demandes dels usuaris per a la construcció d'identitat i identitat personal.
Per tal de generar la veu més adequada i personalitzada per a l'usuari amb trastorns de la parla, l'equip del projecte Xiaomi disposa va reclutar més de 200 voluntaris dins per donar la teva veu. L'algoritme de coincidència de l'empremta de veu es va utilitzar per fer coincidir les característiques de les veus donades pels voluntaris amb les de la veu del destinatari. A través d'aquest enfocament, va ser va trobar la veu més adequada com a so de referència vocal bàsica per al receptor.
Llegiu també: Mi Band 7 surt al descobert complet amb data i preu | foto
Posteriorment, els estudiosos van utilitzar la tecnologia de text a veu d'estil espontani entrenar el model d'IA. D'aquesta manera, un ritme i una entonació naturals capaços d'anar-se afegint a aquesta nova veu expressar les emocions amb veritat i el to d'un ésser humà.
Zhu Xi va afegir:
Si observem i abordem les necessitats dels grups minoritaris en una fase inicial, el procés de difusió de la tecnologia es podria escurçar significativament. Això permet que els beneficis de les noves tecnologies siguin immediatament accessibles per als usuaris amb necessitats especials
L'eix vertebrador d'aquest projecte és un grup de experts en tecnologia de veu de Xiaomi AI Lab. De 2017 han publicat 37 articles en aquest sentit i han estat presents en entorns importants com araConferència internacional sobre acústica, parla i processament del senyal (ICASSP). L'èxit de "Posseeix la meva veu” depèn principalment de l'estil espontani de la tecnologia Text-To-Speech que van desenvolupar. L'estil espontani de la tecnologia Text-to-Speech essencialment fa que la veu sintetitzada soni com un humà real en la seva entonació, pausa, velocitat i altres característiques. Això substitueix la sensació monòtona i antinatural de la veu electrònica per una de més natural.