- Cercetătorii au adunat înregistrări de la 74 de câini de diferite rase și vârste.
- Aceste înregistrări au fost prelucrate cu ajutorul modelului Wav2Vec2, inițial antrenat pe date de vorbire umană.
- Cercetătorii au adaptat modelele pentru a analiza zgomotele câinilor, inclusiv lătratul, mârâitul, scâncetele și alte sunete.
Cercetătorii de la Universitatea din Michigan au realizat un studiu care aplică tehnici de procesare a vorbirii umane pentru a decodifica și clasifica lătratul câinilor.
Această abordare exploatează capacitățile avansate ale modelelor de recunoaștere vocală în a detecta nuanțe precum tonul, accentul și emoțiile din vorbirea umană.
Din echipa de cercetare fac parte Artem Abzaliev, Humberto Pérez Espinosa și Rada Mihalcea, originară din Cluj, profesor de informatică și inginerie la Universitatea din Michigan.
Performanța modelului de procesare a vorbirii umane
Echipa a utilizat un set de date cu înregistrări de lătrat de la 74 de câini. Datele au fost colectate în Tepic (Mexic) și Puebla (Mexic), la domiciliul proprietarilor câinilor.
Rase, vârste și sexe diferite, în context diverse. Înregistrările au fost prelucrate cu ajutorul modelului Wav2Vec2. Inițial antrenat pe date de vorbire umană.
Wav2Vec2 a excelat la patru sarcini de clasificare a lătratului câinilor. A depășit modele special antrenate pe date de lătrat.
Acuratețea a atins până la 70% în:
Identificarea contextului lătratului (joacă, agresivitate etc.)
Recunoașterea rasei câinelui
Estimarea vârstei câinelui
Determinarea sexului câinelui
Asta demonstrează că modelele de procesare a vorbirii umane pot servi drept bază pentru analizarea și înțelegerea comunicării altor specii.
Beneficii pentru bunăstarea animalelor
Înțelegerea lătratului câinilor ar putea îmbunătăți semnificativ modul în care oamenii interpretează și răspund la nevoile emoționale și fizice ale câinilor. Ar putea preveni situații potențial periculoase și ar îmbunătăți îngrijirea generală a animalelor de companie.
Ai putea distinge un lătrat de joacă de unul agresiv și ar putea alerta proprietarul în consecință. Sau poți identifica un lătrat de durere sau discomfort. Astfel ți-ai putea da seama dacă câinele tău are nevoie de îngrijiri medicale.
Limitări și perspective viitoare
Studiul s-a concentrat pe o singură specie, câinii domestici, și doar pe trei rase.
Însă cercetătorii intenționează să extindă acest studiu pentru a analiza și sunete ale altor animale.
O să ajungem să vorbim cu alte specii? Rămâne de văzut.
Dar, tehnicile de interpretabilitate ar putea oferi perspective valoroase asupra procesului decizional al modelelor de învățare profundă.