Платный заказ
Бюджет:
10 000 руб
Здравствуйте
Нам требуется промаркировать значительное (>100 тыс.) количество картинок, чтобы в дальнейшем можно было сделать по ним текстовый поиск.
Нужен скрипт на любом языке (желательно nodejs, php или python), который сможет подключаться к API одной из существующих нейронных сетей (либо своей собственной, но маловероятно, что хватит датасета), формировать запрос, после чего сохранять полученный результат в БД или куда-либо ещё.
Для тестов можете использовать свои ключи, для массового использования мы будем использовать свои ключи, то есть стоимость оплаты самих нейронок на нас.
Мы проверяли через пользовательский интерфейс ChatGPT-4v и Bard, распознают они неплохо, но зависит от промпта, конечно.
На выходе для каждой картинки должны быть:
- список тегов, которые характеризуют эту картинку и по которым потом можно было бы найти её поиском: если есть, то имя персонажа/исполнителя, название аниме/фильма/муз.группы и т.п.
- по возможности краткое текстовое описание самой картинки, но не в плане цветов и "девочка сидит на траве", а про этого персонажа/муз.группу и т.п., обычно нейронки довольно охотно это делают это мы потом тоже будем использовать для поиска
- если распознать невозможно, то должен быть тег "нераспознано"
- должна быть указана степень достоверности распознавания
Всё это должно отдаваться в JSON'е для каждой картинки.
Характеристики картинок:
- размер входящей картинки от 800x800px (обычно порядка 1200x1200px)
- очень много разного аниме и персонажей оттуда (если картинка в принципе из аниме, то должен также формироваться тег "аниме", если не из аниме, то тег "не анме"), включая всяких вокалоидов
- много персонажей из фильмов и мультфильмов
- логотипы муз.групп и известных марок
- исполнители музыки, включая K-Pop и J-pop артистов
- логотипы и персонажи из компьютерных игр
- бывают просто тексты на картинке, сами тексты можно не распознавать, а помечать тегом "текстовые"
Сами картинки вышлем по запросу.
В плане стоимости распознавания нейронками, чем меньше токенов, тем лучше, разумеется.
Если уже делали аналогичную работу это большой плюс.
Можем работать через безопасную сделку.