Команда беларусов запустила бесплатный Telegram-бот по поиску жилья в Польше — @RentAI_PL_bot. Он собирает данные с платформы онлайн-объявлений OLX и предоставляет варианты арендного жилья по запросу. Пока бот работает только по Польше, но создатели планируют позже расшириться на весь ЕС. О проекте Telegram-канал Dzik Pic поговорил с одним из создателей бота Денисом Дыбским, кофаундером венчурной студии DŌBRA.
Что за бот
Особенность бота в том, что он использует естественный язык для поиска квартир. Как поясняет Денис, «по сути, общается с нашей базой и отдаёт результаты пользователю в виде короткого описания и с упором на те параметры, которые ему нужны».
Суть технологии — векторный/семантический поиск, алгоритмическая фильтрация и подробная предобработка данных.
Как это работает
Пользователь пишет на английском запрос наподобие «Show me 3-room apartments in Mokotów with a balcony and pet-friendly» («Покажи мне 3-комнатные квартиры в Мокотуве с балконом и возможностью жить с домашними животными»), и бот присылает восемь подходящих вариантов. Если надо больше восьми, то нужно написать ещё один запрос. На данный момент в базе 37 тыс. квартир для аренды в Польше.
В будущем бот будет коммуницировать с пользователем, уточнять детали и задавать дополнительные вопросы, так как у каждой квартиры более 100 параметров — от балкона до окон на восток.
Почему запрос должен быть именно на английском? Потому что этот язык пока показал наилучший результат в тестах. Денис Дыбский поясняет, что данные собираются на польском с OLX, но затем стандартизируются под английский, так как «были кейсы, когда язык являлся преградой для финальной фильтрации».
«При этом OpenAI хорошо понимает основные европейские языки, — добавляет он. — Но мы столкнулись с тем, что результаты получаются плохого качества, если данные изначально на одном языке, хранение в базе — на другом, а запрос — вообще на третьем. Однако у нас в планах — позволить делать запросы на польском, на русском и на английском».
На чём разработчики будут зарабатывать
Бот бесплатный для конечных пользователей и останется таким в будущем. Монетизация будет идти за счёт других бизнес-моделей.
«Мы хотим зарабатывать с аналитики рынка, различных партнёрских историй, возможно, через комиссионные истории, — поясняет Денис. — Когда подключим поиск по недвижимости на продажу либо по коммерческой недвижимости и у нас будет достаточный объём трафика, то сможем превратить это в деньги».
Собеседник говорит, что уже примерно подсчитал, во сколько ему будет обходиться инфраструктура бота. Но у него с коллегой огромный опыт в парсинге данных, и они знают, как «добывать достаточно большой массив данных условно недорого».
«У меня есть своя инфраструктура, поэтому частично мы её здесь переиспользовали», — добавляет Денис.
На чём работает бот
«Под капотом» у @RentAI_PL_bot — GPT-4o плюс векторная база данных: они нужны, чтобы отдавать максимально релевантные листинги, а потом уже проводить постпроцессинг.
«К примеру, мало кто в листингах указывает конкретный район. Это не суперважный параметр для поиска, но он хорошо ищется именно через векторный поиск, — говорит Денис. — Если в тексте где-либо встречается название района, то этот листинг попадает в предварительную обработку, и дальше уже OpenAI решает, какие конкретные листинги максимально подходят под запрос пользователя.
То есть, по сути, это определение релевантности относительно пользовательского запроса, который можно писать в свободной форме».
Какие планы
«Идей много, — говорит Денис. — При этом у нас уже появился интерес со стороны парочки агентств недвижимости, которые ищут инструмент для управления и поиска большого числа объектов. Отсюда и появился запрос расшириться на Европу. Мы предполагали, что просто сделаем небольшую систему на Польшу, но потом аппетиты выросли. Мы точно будем делать бот и на Германию, и на другие страны».
Подключение недвижимости на продажу, по словам Дениса, — вопрос пары недель. Сейчас команда хочет понять именно недостатки технической реализации.
«Пока тестировали на небольшой группе людей. Сделали несколько итераций, но понимаем, что уже можем запустить в публичный тест», — говорит он.
Вы можете обсудить этот материал в нашем Telegram-канале. Если вы не в Беларуси, переходите и подписывайтесь.