Ето списък с НЛП курсове и специализации, които да ви помогнат да започнете вашето пътуване за обработка на естествен език!
Обработката на естествен език (NLP) се намира в пресечната точка на компютърните науки и компютърната лингвистика. От анализ на настроенията на клиентски отзиви за стимулиране на маркетингови решения до машинен превод и чатботове, NLP захранва всички сектори.
Ако имате опит в изграждането на модели за машинно обучение, можете да добавите NLP към своя инструментариум за решаване на различни проблеми: обобщаване на текст, отговаряне на въпроси, генериране на естествен език и др.
Ще разгледаме общите изисквания за умения за роли в НЛП и след това ще преминем към подбран списък с ресурси, за да започнем с обработката на естествения език.
Съдържание
Кариери в НЛП: НЛП инженер, НЛП разработчик и др
Напредъкът в научните изследвания подхранва развитието на съвременни НЛП техники. Със средна заплата от над 117 000 USD ролите на НЛП инженер и разработчици напоследък придобиха популярност.
Наборът от умения е разнообразен, от събиране на данни за NLP задачи надолу по веригата и практически познания за лингвистични концепции, като анализ на зависимости и маркиране на част от речта (POS), до практически познания за трансформаторни модели.
За да влезете в НЛП, се изискват умения в програмирането и машинното обучение. Трябва също така да имате опит с рамки за дълбоко обучение като PyTorch и TensorFlow и NLP библиотеки като spaCy и HuggingFace.
Курсове по обработка на естествен език (NLP).
След това нека разгледаме някои от най-добрите курсове, налични в популярни платформи за обучение. Ще посочим и предпоставките, от които се нуждаете, за да извлечете максимума от тези курсове. 👩🏫
CS224n: НЛП с дълбоко обучение
Преподаван от проф. Крис Манинг, CS224n: НЛП с дълбоко обучение, предлаган в Станфорд, е един от най-добрите курсове за изучаване на обработка на естествен език. Лекциите са достъпни в YouTube, а бележките за лекции и тетрадките за упражнения – от настоящите и предишни предложения – са свободно достъпни на уебсайта на курса.
📋 Предварителни условия
- Програмиране на Python
- Математика: статистика, вероятности, смятане, линейна алгебра
- Основи за машинно обучение
Това е курс с продължителност семестър, който обхваща широка гама от теми за НЛП:
- Словни вектори
- Повтарящи се невронни мрежи
- Внимание и подсловни модели
- Трансформатори и приложения
💲 Цени: Безплатно ✅
Специализация по НЛП: Coursera
Специализацията за обработка на естествен език от DeepLearning.AI на Coursera е един от популярните ресурси за обучение. Тази специализация има за цел да преподава традиционни техники на НЛП чрез четири курса до най-новите постижения, като модели на трансформатор и реформатор.
📋 Предварителни условия
- Междинен Python
- Машинно обучение и познаване на рамки за дълбоко обучение
- Смятане, линейна алгебра, статистика
Следват курсовете в специализацията:
Всеки курс в специализацията отнема над 30 часа за завършване и отнема няколко месеца за завършване на цялата специализация.
👩🏽💻 Ето някои от проектите, които ще изградите, докато работите по тази специализация:
- Модел за автоматично довършване на текст
- Отговаряне на въпроси с помощта на BERT
- Резюмиране на текст
- Чатбот използва реформаторски модел
НЛП в TensorFlow: Coursera
Ако вече сте запознати с TensorFlow, можете да вземете NLP в TensorFlow от DeepLearning.AI на Coursera, за да изградите NLP модели с TensorFlow.
📋 Предварителни условия
- Python и Math
- Работно познаване на TensorFlow
Курсът обхваща следното:
- Използване на API на TensorFlow за токенизиране и предварителна обработка на текст
- Вграждане на думи
- Генериране на естествен език
Модели на последователности: Coursera
Курсът Sequence Models от DeepLearning.AI на Coursera в специализацията Deep Learning е предназначен да предостави на обучаемите практически познания за НЛП за период от 4 седмици.
📋 Предварителни условия
- Python
- Машинно обучение и линейна алгебра
Курсът обхваща модели на последователност за НЛП с акцент върху следното:
- Рекурентни невронни мрежи на ниво символ (RNN) за езиково моделиране
- Въведение в механизма на вниманието, себе си и вниманието на няколко глави
- Използване на трансформатори Hugging Face за отговаряне на въпроси
НЛП: Прегърнато лице
Екипът на Hugging Face пусна безплатен курс по НЛП, обхващащ основни до напреднали концепции, като се фокусира върху работата с екосистемата Hugging Face.
📋 Предварителни условия
- Владеене на Python
- Работни познания за задълбочено обучение
- Опит с PyTorch и TensorFlow (полезно, но не е задължително)
Курсът има 12 глави и е разделен на три секции, обхващащи следното:
- Използване на трансформатори Hugging Face
- Разбиране на библиотеките с набори от данни и токенизатори
- Усъвършенствани приложения на трансформатори, оптимизиране на модели за производство
Имате достъп до кратки видео лекции, текстови секции за концепции и тетрадки за съвместна работа.
💲 Цени: Безплатно 🤗
НЛП в Google Cloud: Pluralsight
NLP on Google Cloud запознава учащите с изграждането на NLP решения с помощта на Vertex AI в платформата Google Cloud.
Предпоставка: Работни познания по GCP
Този курс запознава обучаемите със следното:
- Текстово представяне
- Работа с DialogFlow API
- Изграждане на невронни мрежи, повтарящи се невронни мрежи (RNNs), мрежи с дългосрочна краткосрочна памет (LSTM) и Gated Recurrent Units (GRUs)
- Използване на Vertex AI
- Механизъм на вниманието и големи езикови модели
Изградете NLP решение с Azure
Изграждане на NLP решение с Microsoft Azure е базиран на проекти курс на Pluralsight. В този курс, базиран на проекти, ще се научите да изграждате NLP решение чрез обработка на набори от данни за туитове на клиентски отзиви.
📋 Предварителни условия
- Програмиране на Python
- Познаване на портала Azure
Ключовите задачи, които ще изпълнявате по пътя, включват следното:
- Откриване на език
- Разпознаване на именуван обект
- Извличане на ключови фрази
- Анализ на настроението
НЛП с PyTorch: Pluralsight
НЛП с PyTorch на Pluralsight ще ви помогне да започнете с НЛП. Този курс не обхваща по-новата трансформаторна архитектура, но обхваща голяма част от обработката на естествен език с PyTorch.
Предпоставка: Познаване на PyTorch
Този курс обхваща следното:
- Повтарящи се невронни мрежи (RNN)
- Двоична и многокласова текстова класификация
- Вграждане на векторни думи
- Анализ на настроението с помощта на вектори на думи
- Модели от последователност към последователност за езиков превод
Да станете НЛП експерт: Udacity
Да станеш NLP експерт е официалната нано степен за обработка на естествен език, предлагана от Udacity’s School of AI. Тази програма за нано степен ще ви помогне да научите както традиционни, така и модерни НЛП техники, като внимание чрез изграждане на проекти.
📋 Предварителни условия
- Програмиране на Python
- Статистика
- Машинно обучение и дълбоко обучение
Програмите на Udacity се състоят от видео лекции, упражнения по кодиране и основни проекти. В този курс за обработка на естествен език ще изградите следните проекти:
- Маркиране на част от речта (POS етикетиране)
- Моделът за машинен превод от край до край
- Модел за разпознаване на реч
Код-първо въведение в НЛП
A Code-First Introduction to NLP е страхотен курс от fast.ai, ако искате да се запознаете със сферата на NLP. Този курс се преподава от Рейчъл Томас и обхваща традиционни и невромрежови подходи към обработката на естествен език.
📋 Предварителни условия
- Програмиране на Python
- Концепции за машинно обучение
- Невронни мрежи с PyTorch (полезно, но не е задължително)
Ето общ преглед на това, което курсът обхваща:
💲 Ценообразуване: безплатно
НЛП с машинно обучение: образователно
Това НЛП с машинно обучение, от Educative, се фокусира върху запознаването на обучаемите с важни концепции в НЛП. От подготовката за интервю за кодиране и системния дизайн до машинното обучение, Educative е една от популярните платформи за онлайн обучение.
Курсът обхваща следното:
- Вграждане на думи
- Езикови модели
- Класификация на текста
- Seq2seq модели
НЛП в Python: DataCamp
Обработката на естествен език в Python от Datacamp е структурирана програма за умения от шест курса. Тези курсове въвеждат обучаемите в различни аспекти на обработката на естествен език.
📋 Предварителни условия
- Владеене на Python
- Разбиране на машинното обучение
Тази писта се състои от следните курсове:
НЛП курс: Лена Войта
Курсът по НЛП е разширение на курса за обработка на естествен език, който авторът, Лена Войта, преподава в училището за анализ на данни Yandex. Курсът е организиран в секции и съдържа интерактивни уроци и публикации в блогове. Освен това има тетрадки и резюмета на научните работи.
- Класификация на текст (както традиционни, така и невронни мрежови подходи)
- Вграждане на думи
- Оценка на езикови модели
- Seq2seq модели и внимание
- Трансфер на обучение за НЛП
💲 Ценообразуване: безплатно
Заключение
Надявам се, че сте намерили този списък с учебни ресурси за полезен. Въз основа на предпоставките и ангажимента за време можете да изберете курса или специализацията, които най-добре отговарят на вашите интереси. След като придобиете основни знания, не забравяйте да изграждате проекти върху набори от данни от реалния свят, за да допълните и подсилите разбирането си. Приятно кодиране!👩🏽💻
След това вижте списъка с тетрадки за наука за данни, които можете да използвате за следващия си НЛП проект!