Проект состоит из четырех частей:
1. Бот для Телеграма, с помощью которого можно:
1. Загрузить изображение (текст без картинок).
2. Получить в ответ распознанный на бэкенде (например, с помощью Tesseract) текст.
2. Бэкенд, распознающий текст. В интернетах хвалят Tesseract, но жесткого требования использовать именно его нет. Если окажется, что какая-то другая библиотека лучше ок.
3. Все изображения хранятся в БД. Что должно быть обязательно предусмотрено:
1. ID загрузки
2. ID бота
3. ID пользователя
4. Время съемки (из мета-данных изображения, если есть)
5. Время загрузки
6. Координаты (из мета-данных изображения)
7. Камера (из мета-данных изображения)
8. Распознанное содержимое
Возможно, какие-то другие данные, но пока это всё.
4. Должен быть простой веб-интерфейс для просмотра изображений с полной информацией и поиску изображений по след. параметрам:
1. Диапазон дат и времени загрузки.
2. id пользователя (по гиперссылке из описания пользователя и через поле ввода).
3. id бота
Работу предлагаю разбить на несколько коротких этапов.
Документация по ботам для Телеграма на русском: