Публичные данные
Открыли публичные датасеты Бонихуа для исследований и разработки
Выложили каталог /datasets, чтобы наши данные можно было использовать не только внутри проекта. Теперь это нормальная входная точка для исследователей, редакторов, продуктовых команд и тех, кто собирает инструменты вокруг изучения китайского.
Если нужен машиночитаемый слой, открывайте /data/catalog.json. Если удобнее смотреть наборы как репозиторий, часть каталога уже опубликована в GitHub datasets repo.
Для чего это пригодится
Исследования по изучению китайского: уровни, ошибки, навыки, типовые сценарии и учебные паттерны.
Продуктовая разработка: фильтры, поисковые прототипы, внутренние справочники и AI‑подсказки с нормальными источниками.
Редакционная и аналитическая работа: сравнение сущностей, связей и покрытие тем без ручной свалки в таблицах.
Для быстрого старта можно открыть базу упражнений, грамматические темы или уровни HSK. Там уже есть индексируемые страницы, связанные сущности и нормальные внутренние переходы.
4 марта 2026
