Alexander Re
Заказчик Alexander Re magicoutsource | FL.RU

Alexander Re

На сайте 10 месяцев (заходил 4 месяца 24 дня назад)
4
49.33
Рейтинг
49.33
Все (1)       Заказы (1)        Вакансии (0)       Конкурсы (0)
Разместить заказ
22 Октября 2023
Здравствуйте
Нам требуется промаркировать значительное (>100 тыс.) количество картинок, чтобы в дальнейшем можно было сделать по ним текстовый поиск.

Нужен скрипт на любом языке (желательно nodejs, php или python), который сможет подключаться к API одной из существующих нейронных сетей (либо своей собственной, но маловероятно, что хватит датасета), формировать запрос, после чего сохранять полученный результат в БД или куда-либо ещё.

Для тестов можете использовать свои ключи, для массового использования мы будем использовать свои ключи, то есть стоимость оплаты самих нейронок на нас.
Мы проверяли через пользовательский интерфейс ChatGPT-4v и Bard, распознают они неплохо, но зависит от промпта, конечно.

На выходе для каждой картинки должны быть:
- список тегов, которые характеризуют эту картинку и по которым потом можно было бы найти её поиском: если есть, то имя персонажа/исполнителя, название аниме/фильма/муз.группы и т.п.
- по возможности краткое текстовое описание самой картинки, но не в плане цветов и "девочка сидит на траве", а про этого персонажа/муз.группу и т.п., обычно нейронки довольно охотно это делают – это мы потом тоже будем использовать для поиска
- если распознать невозможно, то должен быть тег "нераспознано"
- должна быть указана степень достоверности распознавания
Всё это должно отдаваться в JSON'е для каждой картинки.

Характеристики картинок:
- размер входящей картинки от 800x800px (обычно порядка 1200x1200px)
- очень много разного аниме и персонажей оттуда (если картинка в принципе из аниме, то должен также формироваться тег "аниме", если не из аниме, то тег "не анме"), включая всяких вокалоидов
- много персонажей из фильмов и мультфильмов
- логотипы муз.групп и известных марок
- исполнители музыки, включая K-Pop и J-pop артистов
- логотипы и персонажи из компьютерных игр
- бывают просто тексты на картинке, сами тексты можно не распознавать, а помечать тегом "текстовые"

Сами картинки вышлем по запросу.
В плане стоимости распознавания нейронками, чем меньше токенов, тем лучше, разумеется.
Если уже делали аналогичную работу – это большой плюс.
Можем работать через безопасную сделку.

Прошло времени с момента публикации: 6 месяцев 9 дней 21 час 45 минут
Раздел: AI — искусственный интеллект / Нейронные сети
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».