Публичные данные

Открыли публичные датасеты Бонихуа для исследований и разработки

Выложили каталог /datasets, чтобы наши данные можно было использовать не только внутри проекта. Теперь это нормальная входная точка для исследователей, редакторов, продуктовых команд и тех, кто собирает инструменты вокруг изучения китайского.

Если нужен машиночитаемый слой, открывайте /data/catalog.json. Если удобнее смотреть наборы как репозиторий, часть каталога уже опубликована в GitHub datasets repo.

Для чего это пригодится

Исследования по изучению китайского: уровни, ошибки, навыки, типовые сценарии и учебные паттерны.

Продуктовая разработка: фильтры, поисковые прототипы, внутренние справочники и AI‑подсказки с нормальными источниками.

Редакционная и аналитическая работа: сравнение сущностей, связей и покрытие тем без ручной свалки в таблицах.

Для быстрого старта можно открыть базу упражнений, грамматические темы или уровни HSK. Там уже есть индексируемые страницы, связанные сущности и нормальные внутренние переходы.

Открыть каталог датасетов Открыть JSON‑каталог GitHub datasets repo Все новости

4 марта 2026

Открыли публичные датасеты Бонихуа для исследований и разработки

Для чего это пригодится

Редакция Бонихуа