left-topright-bottom
Разработка программного обеспечения
Подбор

Разработчик ML 🆔 BD-8976

Middle+
Rate

1 RUB per hour

Number of specialists

1

Period of attraction

3+ мес

Schedule

Удалённая работа

Required location

Россия

Citizenship

Россия

Industry

Разработка программного обеспечения

Customer

RedLab

Mandatory requirements

Разработчик ИИ на Python
Нужен спец кто это сможет сделать в части ИИ , подготовить классификатор для бота
transformers, huggingface, sklearn
sentence-transformers, huggingface, sklearn, openai (если генерация датасета с LLM)
Python, FastAPI

Tasks

Дообучение (файнтюнинг) классификатора на базе BERT для распознавания различных услуг (в зависимости от навыка услуги меняются, на одном навыке может быть 1-3 классификатора)
Проанализировать полученный от заказчика датасет. Оценить его пригодность для дообучения классификатора. 
Провести редактуру датасета и его обогащение – например, добавление разнообразных фраз пользователя, добавление класса «другое».
Если тренировочный датасет мал, сгенерировать отдельный датасет для тестирования дообученного классификатора.
Дообучить классификатор для распознавания наша/не наша услуга, какая именно услуга;
Протестировать классификатор.
Распознавание и извлечение имён из запросов пользователей (задача решена, можно переиспользовать модуль из Москвёнка)
Используется библиотека natasha
+ На каждом навыке нужно отдельное тестирование (при необходимости генерация тестового датасета)
Распознавание намерений пользователей (согласен/не согласен, вариации) – есть модуль на Москвёнке, можно адаптировать под другие навыки.
Решение основано на нахождении наименьшей косинусной близости между фразой пользователя и текстом, соответствующим положительному ответу (Да, согласен, подтверждаю) или отрицательному (Нет, не надо, не подтверждаю). В качестве эмбеддинговой модели применяется BERTA.
+ На каждом навыке нужно отдельное тестирование (при необходимости генерация тестового датасета)
Другие NLP-задачи, которые могут быть актуальны для конкретного навыка. Например, распознавание, хочет ли пользователь изменить дату или изменить услугу либо сказал что-то не относящееся к диалогу. Подобные задачи, как вариант, тоже можно решать по косинусной близости.
Написание сервисов для каждой задачи (классификация услуги, распознавание имен, определение намерений пользователя и т.д.) согласно бизнес-логике проекта, реализация API для взаимодействия с этими сервисами.
На Москвёнке было 5 таких сервисов.
+ логгирование
+ обработка ошибок

Description of the project and the team

Header Logo