Датасет

Типичные ошибки русскоязычных — китайский без ловушек

Список типичных ошибок и быстрые исправления.

Каталог данных: /ai·JSON: catalog.json

Большинство ошибок в китайском у русскоязычных предсказуемы. Мы слышим их снова и снова: неправильные тоны, калька с русского порядка слов, отсутствие счётных слов или лишнее 是. Этот каталог фиксирует именно такие «болячки», чтобы вы могли быстро понять причину и перестать топтаться на месте.

Каждая карточка включает объяснение, корректный вариант и пример, который можно сразу взять в речь. Это удобно и для самостоятельной работы, и для уроков: преподаватель может объяснить, что именно ломается, а ученик — увидеть, как звучит правильная форма. Мы сознательно убрали лишнюю теорию и оставили то, что реально влияет на понимание.

Как использовать: выберите 1–2 ошибки, которые встречаются у вас чаще всего, и сосредоточьтесь на них в течение недели. Проговаривайте правильные фразы вслух, фиксируйте тон и порядок слов. Исправление 2–3 ключевых ошибок часто даёт больше эффекта, чем выученные ещё 200 слов.

Последняя редакторская проверка: Редакция Бонихуа, 31 марта 2026 г..

Проверил: Дмитрий Петренко, главный редактор; Анна Смирнова, фактчек и валидация данных.

Методология и стандарты редакции: /editorial-policy

Trust и методология

Источник: datasets/learning/common-mistakes-ru.jsonl

Внешний архив: Zenodo / DOI

Проверка: Валидация схемой Zod, проверка связей related_ids и статическая сборка маршрутов.

Частота обновления: При каждом обновлении датасета и пересборке manifest.

Ограничения: Данные носят справочный характер и не являются публичной офертой.

Лицензия: CC-BY-NC-SA-4.0. Условия использования.

Коммерческое использование — по запросу на hello.bonihua@gmail.com.

Quality score: 96%.

Битые related_ids: 48. Последняя проверка: 31 марта 2026 г..

Отчёт: reports/dataset-audit-2026-02-13.md

Citation asset

Где русскоязычные ломают китайский быстрее всего

Этот набор работает как citation-first страница: показывает не абстрактные «ошибки учеников», а конкретные провалы, которые можно быстро диагностировать, исправить и использовать в product/content слое.

Записей

4

Столько типичных ошибок уже разобрано в каталоге.

Фонетика и тоны

1

Ошибки, которые меняют смысл уже на уровне слова.

Грамматика и структура

3

Провалы в порядке слов, классификаторах и связках.

Стартовые уровни

4

Карточки, которые особенно полезны на раннем этапе обучения.

Что из этого важно

  • Фонетика и тоны здесь не побочный шум, а главный источник смысловых поломок.
  • Большая часть проблем сидит в базе HSK1-HSK2: порядок слов, счётные слова, лишнее 是 и неправильный тон.
  • Набор удобен не только для чтения, но и как weekly remediation layer: берёте 1 ошибку и строите вокруг неё микро-дриллы.

Кому это полезно

  • Для ученика: быстро понять, почему речь «звучит криво», даже если слова вроде бы выучены.
  • Для преподавателя: собрать remediation sprint на неделю вместо расплывчатого «повтори базу».
  • Для SEO и AI answers: ссылаться на конкретный список ошибок, а не на общую статью про трудности китайского.

Примеры записей

Ниже несколько реальных записей из набора. Это удобно и для SEO-цитирования, и для быстрой оценки, подойдёт ли датасет под ваш урок, исследование или AI pipeline.

Вставляют 是 везде, где его не нужно
{
  "id": "mistake:shi-overuse",
  "slug": "shi-overuse",
  "name": "Вставляют 是 везде, где его не нужно",
  "desc": "是 используется как «есть» в русском, хотя в китайском это не всегда нужно (особенно с прилагательными).",
  "when": "Типично для описаний типа «я студент» (нужно), «это вкусно» (не нужно), «он высокий» (не нужно).",
  "how": "Запомните: с прилагательными чаще всего 是 не ставится. Используйте 很/挺/非常.",
  "tags": [
    "grammar",
    "copula",
    "hsk1"
  ]
}
Забывают счётные слова
{
  "id": "mistake:classifiers",
  "slug": "classifiers",
  "name": "Забывают счётные слова",
  "desc": "После числа ставят существительное напрямую, как в русском, без классификатора (счётного слова).",
  "when": "Ошибка всплывает в покупках, времени, количестве людей/вещей.",
  "how": "Выучите 5–7 самых частотных классификаторов и фиксируйте их вместе со словами.",
  "tags": [
    "grammar",
    "measure-words",
    "hsk2"
  ]
}
Игнорируют тоны — и слово превращается в другое
{
  "id": "mistake:tones-ignored",
  "slug": "tones-ignored",
  "name": "Игнорируют тоны — и слово превращается в другое",
  "desc": "Самая частая ошибка русскоязычных: «слово» выучено по буквам, но произнесено с неверным тоном, из-за чего меняется смысл.",
  "when": "Проявляется на старте и потом всплывает в спонтанной речи, когда скорость растёт.",
  "how": "Закрепляйте тон вместе со словом, а не отдельно. Записывайте себя и сверяйте с эталоном.",
  "tags": [
    "pronunciation",
    "tones",
    "beginner"
  ]
}
Русский порядок слов в китайском
{
  "id": "mistake:word-order",
  "slug": "word-order",
  "name": "Русский порядок слов в китайском",
  "desc": "Фраза звучит как калька с русского: смысл понятен, но «ломается» китайский порядок слов, особенно с обстоятельствами времени и места.",
  "when": "Проявляется в сложных фразах и при попытке объяснить причину/следствие.",
  "how": "Учите шаблоны и связки: «сначала → потом», «потому что → поэтому», «сделал → результат».",
  "tags": [
    "grammar",
    "word-order",
    "hsk2"
  ]
}

Популярные элементы

Вставляют 是 везде, где его не нужно

是 используется как «есть» в русском, хотя в китайском это не всегда нужно (особенно с прилагательными).

grammarcopulahsk1

Забывают счётные слова

После числа ставят существительное напрямую, как в русском, без классификатора (счётного слова).

grammarmeasure-wordshsk2

Игнорируют тоны — и слово превращается в другое

Самая частая ошибка русскоязычных: «слово» выучено по буквам, но произнесено с неверным тоном, из-за чего меняется смысл.

pronunciationtonesbeginner

Русский порядок слов в китайском

Фраза звучит как калька с русского: смысл понятен, но «ломается» китайский порядок слов, особенно с обстоятельствами времени и места.

grammarword-orderhsk2
Страница 1 из 1 · элементов: 4

Смотрите также

FAQ

Почему ошибки не уходят даже после занятий?

Потому что ошибка закрепилась как привычка. Нужно не просто «знать правило», а переучить моторный паттерн: речь, интонацию, порядок слов.

Как быстро исправить 1–2 ключевые ошибки?

Сработает концентрация: выбираете одну ошибку на неделю, записываете себя и делаете короткие дриллы каждый день. 5 минут, но регулярно.

Цитирование

Цитирование и интеграция

https://www.bonihua.ru/datasets/common-mistakes-ru

Прямая ссылка на этот ресурс. Используйте для шеринга.

Скачать

Используйте этот датасет в исследованиях, приложениях или для обучения ИИ. Данные доступны в JSON.

groups
Доверие и опыт

Редакция Бонихуа

Мы — люди, которые сами прошли путь изучения китайского. Больше 10 лет мы преподаём язык, жили в Китае и обучили тысячи студентов. В этом блоге мы делимся не теорией из учебников, а живым опытом. Мы здесь, чтобы ваш путь в китайском был короче и ярче.