Датасет

Произношение китайского — ловушки и пары звуков

Открытый датасет Бонихуа по произношению китайского: тоновые ошибки, путаница pinyin и ловушки, которые особенно часто мешают русскоязычным ученикам.

Каталог данных: /ai·JSON: catalog.json

Это открытый датасет Бонихуа о типичных фонетических ошибках русскоязычных в китайском. Внутри не абстрактные советы, а конкретные ловушки: путаница тонов, финалей, согласных и ритма фразы. Мы фиксируем, где именно ломается произношение, почему это мешает пониманию и каким упражнением ошибку лучше чинить.

Набор полезен сразу в двух сценариях. Репетитор по китайскому может быстро собрать фонетическую диагностику, выбрать минимальные пары и объяснить ученику, почему «почти правильно» в китайском часто означает другое слово. Ученик получает короткие, практичные карточки для самостоятельной отработки: что слушать, что проговаривать и на чём держать внимание.

Как использовать: не хватайтесь за всё сразу. Возьмите одну ловушку на 3–4 дня, проговорите пары медленно, затем в коротких фразах и только потом ускоряйтесь. Лучше 7 минут в день без геройства, чем 40 минут раз в неделю с драмой и кашей в ушах.

Последняя редакторская проверка: Редакция Бонихуа, 31 марта 2026 г..

Проверил: Дмитрий Петренко, главный редактор; Анна Смирнова, фактчек и валидация данных.

Методология и стандарты редакции: /editorial-policy

Trust и методология

Источник: datasets/learning/pronunciation-traps.jsonl

Внешний архив: Zenodo / DOI

Проверка: Валидация схемой Zod, проверка связей related_ids и статическая сборка маршрутов.

Частота обновления: При каждом обновлении датасета и пересборке manifest.

Ограничения: Данные носят справочный характер и не являются публичной офертой.

Лицензия: CC-BY-NC-SA-4.0. Условия использования.

Коммерческое использование — по запросу на hello.bonihua@gmail.com.

Quality score: 96%.

Битые related_ids: 48. Последняя проверка: 31 марта 2026 г..

Отчёт: reports/dataset-audit-2026-02-13.md

Как использовать

Репетитору по китайскому: Используйте записи как готовую карту диагностики: на первом уроке отмечайте 3–5 ловушек ученика, затем собирайте из них короткий фонетический маршрут на две недели.

Ученику китайского: Используйте датасет как чек-лист практики: берите одну ошибку, повторяйте минимальные пары, затем вставляйте их в короткие бытовые фразы и записывайте себя на диктофон.

Поля датасета

idstring

Стабильный идентификатор записи в формате `prontrap:<slug>`.

slugstring

Читаемый slug для URL, GitHub и внутренней перелинковки.

name.rustring

Короткое название ловушки человеческим русским языком.

desc.rustring

Что именно путают русскоязычные ученики и почему это мешает.

when.rustring

В какой ситуации ошибка всплывает чаще всего: чтение, диалог, диктант, скоростная речь.

how.rustring

Практический способ коррекции для урока или самостоятельной тренировки.

pairstring

Краткое обозначение конфликтующей пары тонов, звуков или ритмических паттернов.

minimal_pairsarray

Минимальные пары или микроконтрасты для отработки слуха и артикуляции.

tagsarray

Теги для фильтров, SEO и сценариев использования в уроках.

related_idsarray

Связанные записи внутри датасета для последовательной отработки.

Примеры записей

Ниже несколько реальных записей из набора. Это удобно и для SEO-цитирования, и для быстрой оценки, подойдёт ли датасет под ваш урок, исследование или AI pipeline.

Второй и третий тон в коротких вопросах
{
  "id": "prontrap:tone-2-vs-3-in-questions",
  "slug": "tone-2-vs-3-in-questions",
  "name": "Второй и третий тон в коротких вопросах",
  "desc": "Во фразах вроде nǐ, hǎo, mǎi, měi русскоязычные часто смешивают второй и третий тон, особенно когда спешат.",
  "when": "Ошибка регулярно всплывает в вопросах и коротких диалогах: nǐ qù ma, mǎi ma, hǎo ma.",
  "how": "Тренируйте не отдельный слог, а короткую фразу: nǐ hǎo, nǐ mǎi ma, nǐ qù ma. Второй тон идёт вверх, третий сначала ныряет вниз.",
  "tags": [
    "tones",
    "questions",
    "speaking"
  ],
  "pair": "2-й тон ↔ 3-й тон",
  "minimal_pairs": [
    {
      "bad": "mái",
      "good": "mǎi",
      "note": {
        "ru": "Не пытайтесь «петь» третий тон слишком глубоко; важен контраст движения."
      }
    },
    {
      "bad": "hái",
      "good": "hǎi",
      "note": {
        "ru": "Полезно сопровождать тон жестом рукой."
      }
    }
  ]
}
Русское ударение перебивает китайские тоны
{
  "id": "prontrap:russian-stress-overrides-tones",
  "slug": "russian-stress-overrides-tones",
  "name": "Русское ударение перебивает китайские тоны",
  "desc": "Даже когда ученик знает тоны по отдельности, русская привычка ставить одно главное ударение ломает весь тональный рисунок слова.",
  "when": "Ошибка слышна в длинных словах, связках и мини-диалогах: péngyou, shénme shíhou, bù kěyǐ.",
  "how": "Дробите слово на ритмические блоки и следите, чтобы каждый слог сохранял свой контур. Полезно читать под метроном и делать запись.",
  "tags": [
    "rhythm",
    "tones",
    "connected-speech"
  ],
  "pair": "китайский тональный рисунок ↔ русское силовое ударение",
  "minimal_pairs": [
    {
      "bad": "péngyou",
      "good": "PENGyou",
      "note": {
        "ru": "Во втором варианте русское ударение съедает тональную картину."
      }
    },
    {
      "bad": "bù kěyǐ",
      "good": "bu KEyi",
      "note": {
        "ru": "Держите тоны на каждом слоге, а не один главный акцент."
      }
    }
  ]
}
Третий тон перед третьим тоном
{
  "id": "prontrap:third-tone-sandhi-before-third-tone",
  "slug": "third-tone-sandhi-before-third-tone",
  "name": "Третий тон перед третьим тоном",
  "desc": "Русскоязычные знают правило sandhi теоретически, но в речи всё равно произносят два полных третьих тона подряд.",
  "when": "Проблема звучит в 你好, 很好, 可以吗, 老板好 и в устойчивых бытовых сочетаниях.",
  "how": "Тренируйте пары как готовые блоки: ní hǎo, hén hǎo, xiǎng mǎi. Не разбирайте их каждый раз заново по слогам.",
  "tags": [
    "tones",
    "sandhi",
    "connected-speech"
  ],
  "pair": "3-й тон + 3-й тон",
  "minimal_pairs": [
    {
      "bad": "nǐ hǎo",
      "good": "ní hǎo",
      "note": {
        "ru": "Полезно услышать обе версии подряд, чтобы ошибка стала заметной."
      }
    },
    {
      "bad": "hěn hǎo",
      "good": "hén hǎo",
      "note": {
        "ru": "Отрабатывайте именно в частотных связках."
      }
    }
  ]
}
Финали an и ang
{
  "id": "prontrap:an-vs-ang-final",
  "slug": "an-vs-ang-final",
  "name": "Финали an и ang",
  "desc": "Русскоязычные часто не дотягивают носовой хвост в ang и получают слишком короткое an.",
  "when": "Ошибка заметна в словах hǎn/hǎng, lán/láng, bàn/bàng и при чтении списков без записи.",
  "how": "На ang оставляйте звук дольше и давайте ощущение заднего носового резонанса. Полезно петь пары на одном тоне: an-an-ang-ang.",
  "tags": [
    "pronunciation",
    "finals",
    "nasals"
  ],
  "pair": "an ↔ ang",
  "minimal_pairs": [
    {
      "bad": "lán",
      "good": "láng",
      "note": {
        "ru": "В ang не обрывайте слог слишком рано."
      }
    },
    {
      "bad": "bān",
      "good": "bāng",
      "note": {
        "ru": "Слушайте именно хвост финали, а не начальный согласный."
      }
    }
  ]
}

Популярные элементы

Без записи кажется, что всё уже нормально

Фонетическая ошибка часто не слышна изнутри, и ученик уверен, что произносит чисто, пока не послушает запись.

trainingfeedbackpronunciation

Второй и третий тон в коротких вопросах

Во фразах вроде nǐ, hǎo, mǎi, měi русскоязычные часто смешивают второй и третий тон, особенно когда спешат.

tonesquestionsspeaking

Изменение тона у 一

Слог yī часто читают всегда одинаково, хотя его тон зависит от следующего слова.

tonessandhifunction-words

Изменение тона у 不

Необходимая мелочь, которую часто знают глазами, но забывают ртом: перед четвёртым тоном 不 меняет контур.

tonessandhifunction-words

Китайский r в словах rén, ràng, rè

Звук r в китайском часто «растворяется» у русскоязычных, потому что не совпадает ни с русским р, ни с ж.

pronunciationretroflexinitials

Нейтральный тон в 对不起 и 谢谢

В устойчивых формулах вежливости русскоязычные ученики нередко произносят каждый слог полнотонно, и фраза звучит тяжёлой.

tonesneutral-toneetiquette

Нейтральный тон у вопросительной частицы 吗

Русскоязычные часто дают частицы ma полноценный тон, и фраза начинает звучать тяжело и неестественно.

tonesneutral-tonequestions

Пауза между каждым слогом

Русскоязычные ученики часто читают китайский как набор карточек: слог, пауза, слог, пауза. Речь становится неестественной.

rhythmconnected-speechfluency

Первый тон слишком низкий и усталый

Русскоязычные нередко держат первый тон ровным, но слишком низким, из-за чего он перестаёт звучать как китайский первый.

tonespronunciationpitch

Переход со второго тона на четвёртый

Связка 2→4 часто ломается: голос не успевает подняться и резко упасть, поэтому оба слога звучат смазанно.

tonestransitionsspeaking

Проглатывание носовой финали в быстрой речи

На скорости русскоязычные часто теряют носовой хвост, и an/en/in начинают звучать как открытые гласные.

pronunciationfinalsfluency

Ритм в 没有 и 不要

Частотные отрицательные связки звучат неестественно, если произносить их как два тяжёлых полноценных слога без связи.

rhythmfunction-wordsconnected-speech

Русская вопросительная интонация поверх китайских тонов

Вопрос в китайском русскоязычные часто поднимают всей фразой вверх, и тоны при этом теряют свой рисунок.

intonationquestionstones

Русское ударение перебивает китайские тоны

Даже когда ученик знает тоны по отдельности, русская привычка ставить одно главное ударение ломает весь тональный рисунок слова.

rhythmtonesconnected-speech

Скорость включают раньше точности

Русскоязычные ученики часто ускоряются слишком рано и закрепляют ошибочное произношение как привычку.

trainingpronunciationfluency

Тоны есть по отдельности, но исчезают в длинной фразе

Ученик может чисто сказать слог отдельно, но в длинной фразе тональные контуры распадаются на «островки».

rhythmtonesphrases

Третий тон перед третьим тоном

Русскоязычные знают правило sandhi теоретически, но в речи всё равно произносят два полных третьих тона подряд.

tonessandhiconnected-speech

Третий тон тянут слишком театрально

Русскоязычные часто делают третий тон как длинную драму, и в живой речи он начинает тормозить всю фразу.

tonesrhythmconnected-speech

Финали ai и ei

Русскоязычные часто тянут ai слишком широко или, наоборот, выпрямляют ei до непонятного среднего звука.

pronunciationfinalsdiphthongs

Финали an и ang

Русскоязычные часто не дотягивают носовой хвост в ang и получают слишком короткое an.

pronunciationfinalsnasals

Финали ao и ou

Пара ao/ou часто смазывается, особенно если ученик читает pinyin глазами и не проверяет себя на слух.

pronunciationfinalsdiphthongs

Финали en и eng

Пара en/eng кажется мелочью, но в китайском это разные финали и разное восприятие слова на слух.

pronunciationfinalsnasals

Финали ian и iang

В быстрой речи русскоязычные часто теряют различие между ian и iang, особенно если слово уже знакомо по иероглифам.

pronunciationfinalsvowels

Финали in и ing

Русскоязычные нередко делают in слишком коротким или, наоборот, размывают ing до неопределённого «ин».

pronunciationfinalsnasals

Финали o и uo

Слог с uo часто упрощают до o, и слово теряет привычный китайский рисунок.

pronunciationfinalsglides

Частица 了 в конце фразы слишком тяжёлая

Русскоязычные часто произносят конечную 了 как отдельный важный слог, хотя в разговорной речи она обычно легче.

tonesparticlesconnected-speech

Частица 呢 с лишним ударением

Вопросительная 呢 у русскоязычных часто получает ударение, хотя в китайской фразе она обычно служебная и лёгкая.

tonesparticlesquestions

Четвёртый тон без резкого падения

Четвёртый тон часто произносят как просто «строгое слово», но без нужного короткого падения вниз.

tonespitchspeaking

Чтение pinyin «по буквам»

Некоторые ученики пытаются читать pinyin как латиницу, и тогда слоговая логика китайского исчезает.

pinyinreadingpronunciation

B и P различают не голосом, а придыханием

Русскоязычные часто переносят логику звонких и глухих согласных из русского, хотя в китайском важнее придыхание.

pronunciationaspirationinitials

C теряет придыхание и превращается в z

Русскоязычные часто не слышат и не делают придыхание у c, поэтому c и z начинают сливаться.

pronunciationaspirationinitials

D и T: русская логика мешает

Как и с b/p, русскоязычные часто ищут «звонкость», а китайский просит слышать силу выдоха.

pronunciationaspirationinitials

E и o после g/k/h

После g/k/h русскоязычные ученики часто читают финаль слишком «по-английски» или уводят её в знакомое русское o.

pronunciationfinalsvowels

Er и erhua

Русскоязычные либо вообще избегают звука er, либо перегибают его в грубое русское «эр».

pronunciationretroflexconnected-speech

G и K: слабое и сильное придыхание

Пара g/k часто звучит одинаково, когда ученик не контролирует поток воздуха на старте слога.

pronunciationaspirationinitials

H против F

Из-за русского акцента h часто звучит слишком мягко или уезжает в f, особенно в коротких бытовых словах.

pronunciationinitialsairflow

J/Q/X против Zh/Ch/Sh

У русскоязычных эти ряды часто смешиваются, потому что оба звучат как «шипящие», но в китайском они строятся по-разному.

pronunciationinitialsconsonants

L против N в начале слога

Русскоязычные часто сглаживают границу между L и N, особенно в знакомых словах и именах.

pronunciationinitialsconsonants

qing против qin

Пара qing/qin кажется мелочью, но в китайском разница между in и ing критична для слуха и понимания.

pronunciationfinalsnasals

R против L

Китайское r не равно русскому «р», поэтому его нередко уводят либо в l, либо в жёсткое русское рычание.

pronunciationinitialsretroflex

U против ü

Звук ü отсутствует в русском, поэтому его заменяют на обычный u или на русское «ю» без нужной позиции языка.

pronunciationfinalsvowels

X уходит в русское мягкое s

Китайский x часто произносят как «с» или «щ», хотя ему нужна своя позиция языка и более мягкий шум.

pronunciationinitialspinyin

Zh/Ch/Sh против Z/C/S

Русскоязычные часто слышат эти ряды как одно семейство, хотя в китайском это разные зоны артикуляции и другой смысл.

pronunciationinitialspinyin

zhi/chi/shi/ri против zi/ci/si

Русскоязычные часто слышат здесь одно и то же «и», хотя китайский различает два разных типа слогообразующего гласного.

pronunciationpinyinapical-vowels

谢谢 превращается в «шеше»

Частотное слово xièxie часто звучит как shèshe, потому что ученик смешивает x и sh на автомате.

pronunciationetiquettehigh-frequency
Страница 1 из 1 · элементов: 45

Смотрите также

FAQ

Сколько времени нужно, чтобы поставить произношение?

Первые заметные улучшения приходят через 2–3 недели регулярной практики. Полная автоматизация — это месяцы, но она реалистична.

Можно ли тренировать произношение без преподавателя?

Да, если вы записываете себя и сравниваете с эталоном. Но корректный фидбек ускоряет процесс в разы.

Цитирование

Цитирование и интеграция

https://www.bonihua.ru/datasets/pronunciation-traps

Прямая ссылка на этот ресурс. Используйте для шеринга.

Скачать

Используйте этот датасет в исследованиях, приложениях или для обучения ИИ. Данные доступны в JSON.

groups
Доверие и опыт

Редакция Бонихуа

Мы — люди, которые сами прошли путь изучения китайского. Больше 10 лет мы преподаём язык, жили в Китае и обучили тысячи студентов. В этом блоге мы делимся не теорией из учебников, а живым опытом. Мы здесь, чтобы ваш путь в китайском был короче и ярче.