Безопасни и частни ли са онлайн услугите за транскрипция?

Транскрипцията някога е била ръчен, досаден процес. Лекари, журналисти и редица различни професионалисти записваха своите бележки и разговори на драскава диктофонна лента и след това сядаха пред компютрите си, за да ги напишат.

Превъртете бързо напред към 2020 г. и има различни услуги, които можете да използвате, за да превърнете аудиозапис в текст на екрана на компютъра. Остава обаче един въпрос: безопасни ли са? В крайна сметка може да качвате гласови записи на чувствителни разговори и частни гласови съобщения.

Нека да разгледаме тези услуги и как можете да защитите вашата информация.

Как работят услугите за аудио транскрипция

Услугите за аудио транскрипция обикновено се разделят на три лагера. Първият е изцяло управляван от компютър и използва съществуващите модели на AI и машинно обучение за обработка на разговора. Вторият е най-скъп, защото хората вършат тежката работа. Третата е комбинация от компютърна обработка и хора.

Вероятно сте най-запознати с първата категория. Услуги за гласова транскрипция – като тези, предлагани от Google, Apple и Otter.ai— преобразувайте аналоговите вълни, които вашият глас създава, в цифрово представяне. След това ги разделя на малки (понякога, една хилядна от секундата) сегменти и ги съпоставя с известни „фонеми“ или елементи на език.

  Как да замразите или скриете колони и редове в Google Sheets

След това тези алгоритми се опитват да ги изследват в контекста на други фонеми и да ги поставят през статистически и AI модели, които в крайна сметка произвеждат текст. Тъй като тези услуги за транскрипция са изцяло управлявани от компютър, те обикновено са най-евтините за изпълнение. Въпреки това, точността не винаги е на място, особено когато става въпрос за извличане на текст от шумна среда или среда с множество хора.

Транскрипцията, задвижвана от човека, включва специални платформи, напр Rev, които свързват клиентите с набор от предварително одобрени преписвачи. Можете също да наемете някой от пазара на свободна практика, например Upwork или Fiverr, да транскрибирам за вас.

И накрая, има смесица от двете. За да ускорят процеса на транскрипция, някои сайтове позволяват на AI да извърши предварителната работа, а след това някой подрежда изхода и коригира всички грешки.

Услугите за транскрипция се държат зле

През последните години много услуги за транскрипция бяха обект на нарушения и скандали.

Може би най-старият (и може би най-шокиращ) беше SpinVox, който през 2000-те предлагаше услуга, която превръща гласовата поща в SMS съобщения. По това време това се смяташе за нищо друго освен технологичен пробив. Фирмата бързо привлече позитивна преса, клиенти и огромни ровове от финансиране.

Проблемът? Без да знаят клиентите, гласовата им поща беше обработвани от хора, работещи от офиси на места като Пакистан, Мавриций и Южна Африка. Един вътрешен човек на компанията твърди, че само 2 процента от гласовите съобщения са били машинно обработени, а останалите са обработвани от около 10 000 експлоатирани работници.

  Какво означава „IKR“ и как го използвате?

Когато служителите в пакистански офис на SpinVox не получиха заплащане, те започнаха да изпращат съобщения директно до клиентите, за да протестират. В крайна сметка истината излезе наяве и SpinVox загуби голяма част от стойността си. В крайна сметка остатъците от компанията бяха продадени на Нюанс, един от най-големите доставчици на гласово разпознаване в света.

Съвсем наскоро журналистът по киберсигурност Брайън Кребс откри сериозен пробив, възникнал в MEDantex, базиран в Канзас доставчик на услуги за гласова транскрипция за медицински специалисти. Очаквано бяха изтекли данни (някои от които датират от 2007 г.), съдържащи чувствителни медицински досиета. Съдържанието може да бъде изтеглено от несигурен портал като файлове на Microsoft Word.

Дори услугите за цифрова транскрипция не са безопасни. В крайна сметка, когато използвате изцяло компютърно управлявана услуга, фирмата може да използва човешки изпълнители за извършване на контрол на качеството.

През 2019 г., белгийски новинарски сайт, VRT NWS, откриха, че изпълнителите на Google слушат разговори между отделни лица и техните умни асистенти на Google Home. Един изпълнител дори предостави на VRT NWS достъп до разговори, много от които бяха от дълбоко чувствителен (а в някои случаи и сексуално интимен) характер.

Amazon, Apple и Microsoft също използваха изпълнители по този начин. С други думи, някой може да слуша гласови записи от вашия виртуален асистент.

  Как да използвате мишка с вашия iPad или iPhone

Безопасни ли са онлайн услугите за транскрипция?

Най-важният въпрос е дали услугите за онлайн транскрипция са безопасни. За съжаление отговорът е малко сложен.

Пространството за гласова транскрипция в този момент е до голяма степен зряло. Най-впечатляващите лоши актьори бяха отстранени.

Въпреки това, когато поверите своите данни (в този случай лични разговори) на трета страна, вие разчитате на нея, за да ги защити. Това важи също толкова за онлайн услугите, колкото и за човешките преписващи.

В крайна сметка трябва да се запитате две неща: Доверявате ли се на услугата и колко чувствителни са вашите разговори?

Когато търсите услуга за транскрипция, винаги си струва да направите някои изследвания. Фирмата има ли добра репутация? Добре установено ли е? Било ли е обект на пробив на данни в миналото? Има ли политика за поверителност, която изрично посочва как вашите данни ще бъдат обработвани и защитени?

Както споменахме по-рано, услугите, управлявани от изкуствен интелект, често разчитат на служители и изпълнители на трети страни, за да извършват проверки за контрол на качеството. Въпреки че тези проверки представляват част от всички транскрипции, винаги има шанс някой да слуша вашия разговор.

В много случаи обаче това не е нарушител на сделката. Въпреки това, ако разговорът ви е дълбоко личен или чувствителен към търговската цел, може да помислите да отворите текстов редактор и да препишете по старомоден начин.