В каком языке больше всего слов. Что у нас с БАСом? В каком языке больше всего словарный запас

В Оксфордском словаре в четыре раза больше слов, чем в БАСе - Большом академическом словаре русского языка. "Великий и могучий" полон английских заимствований. Школьники перестали понимать Пушкина. Что происходит с русским языком? Рождает ли он новые слова? Почему наши словари такие тонкие? На эти вопросы "РГ" отвечает один из авторов Большого академического словаря русского языка - знаменитого БАСа Людмила Кругликова.

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)... Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов...

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время "похудения" пришлось на Вторую мировую войну и начало "холодной"?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) - 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: "Считается, что словарь английского языка включает примерно миллион слов". Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, "Web 2.0", которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: "Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма - ощущения, что "наши словари больше, чем их словари". Но это на самом деле не делает нас сколь-либо богаче лингвистически".

Но и среди исследователей "великого и могучего" есть лингвистические пессимисты, которые считают, что корни русского языка "бесплодны": не рождают новых слов, а большинство неологизмов имеет иностранное происхождение...

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем "люб", а наши современники знают в три раза меньше. Между тем в "Словообразовательном словаре русского языка" Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем "люб". А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова "про любовь" современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное "книголюб", а затем "природолюб", "однолюбка", "любовь-игра", "любовь-ненависть", "любовь-морковь", "безлюбье". При беглом просмотре я насчитала не менее 40 слов с корнем "люб", которые появились в XX - начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% - катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% - заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома - это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.

Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?

В английском. Поэтому в США на рабочих местах держат словари, чего я никогда не видел в России.
Вот факты:
________________________________________ _______
Сколько слов в Английском языке?
- Около миллиона, или больше.

Трудно предположить, что даже осторожная оценка этого числа будет сильно ниже миллиона. Если включить все научные термины, то оценка даже удвоится. Например, наука описала уже около миллиона насекомых и оценивает число еще неописаных насекомых в несколько миллионов.
Два самых больших Английских словаря включают по полмиллиона слов (или лексем) каждый - the Oxford English Dictionary and Merriam-Webster"s Third New International Dictionary.
http://dictionary.reference.com/help/faq/language/h/howmanywords.html
____________________________________________________________

Сколько слов в русском языке?
В русском языке около 500 тысяч слов . Но наиболее употребительных слов всего от 2000 до 2500. Даже у Пушкина, великого знатока и мастера русского языка, в литературной речи были не все полмиллиона слов, а всего 21197. Ученые обнаружили, что 100 наиболее часто встречающихся слов составляют 20% устной и письменной речи. 1500-2000 слов - это уже 85%. У выпускника средней школы словарный запас составляет от 1500 до 4000 слов. У человека с высшим образованием - до 8000 слов.

А вот 500 английских слов - это уже 70% литературного языка. Как видите, языки совсем разные по выразительности.

Министерство просвещения Японии определило 1850 иегроглифов для повседневного использования, а 881 из них - для изучения в начальных и средних школах. Однако существует ряд иероглифов, применявшихся до конца Второй мировой войны, которые еще нужны для написания имен и адресов. Ежедневные газеты используют около 400 иероглифов. По статистике, 2500-3000 иероглифов составляют 99,9% от общего количества появляющихся в газетах и журналах. Наиболее полный японский словарь содержит 50000 иероглифов.

В.Пекелис "Кибернетическая смесь", М.,"Знание", 1991, стр. 323-324;
"IEEE Proc.", 1985, Vol.68, No.7
http://www.geocities.com/TimesSquare/Maze/8561/facts.htm
___________________________________________

Правда ли, что в Английском больше слов, чем в любом другом языке?

Весьма вероятно и тому существуют исторические причины:
- древний английский принадлежит к Германской Языковой Группе. Он близок Немецкому и Голландскому, разделяя их грамматику и словари.
- после Норманнского Завоевания Англии в 1066 году, Английский впитал в себя Норманно-Французский диалект, ставший языком правящего класса на долгие века.
- помимо этих двух, Английский принял многое из Латыни, бывшей в средние века языком Науки и Церкви. Принятие Латыни началось еще с Римского завоевания и вошло во многие топонимы.

Поэтому, словарь Английского намного обширнее словарей любого из Германских или Романских (к которым принадлежат Французский и Латынь) языков.
В силу указанных причин, Английский традиционно с легкостью впитывает в себя любые иностранные слова. С ростом Британской Империи, Английский стал языком международного общения и впитал в себя множество иностранных слов из самых разнообразных колониальных источников (индийских, африканских, австралийских, американских и т.п.)

Вопрос о том, сколько в русском языке слов, довольно противоречив, как и сам ответ на него. Нужно учитывать, включаются ли в общее число русских слов наречия, частицы, производные словоформы и по каким источникам наиболее правильно можно произвести расчет словесных обозначений.

При помощи объемного и красочного русского языка можно передать любые эмоции, чувства, переживания, описать увиденное и даже услышанное, создать яркую словесную картину.

Великий и могучий русский язык

При этом важно пользоваться грамотным русским языком, а не искусственно выведенными формами слов уличного происхождения. Хотя довольно популярны и словоформы из других языков, прочно закрепившиеся в нашем языке.

Но при подсчете конкретно русских слов многие понятия и обозначения не учитываются по определенному ряду причин. Кроме того, существует ряд словарный «отклонений», которые обычно не входят в состав словарей, вобравших в себя все богатство русского языка. Среди них можно выделить:

  • Профессионализмы
  • Диалектизмы
  • Жаргонизмы

Особое место в русском языке занимают специальные термины технического, научного, промышленного характера. Такие слова также зачастую не входят в состав словарей, так как узконаправленны и по большому счету малоизвестны.

Разнообразие и богатство русских словарей

Для более точного определения количества слов в русском языке используются классические виды словарей. Чаще всего обращаются к таким видам собраний русскоязычных словоопределений:

  1. БАС – Большой Академический словарь насчитывает 131 257 слов.
  2. Словарь В. И. Даля – более 200 тысяч слов.
  3. Словарь Ожегова в своем единственном томе представлен 57-мью тысячами слов.
  4. Словарь редакции Ушакова состоит из слов, число которых более 85 тысяч.

Существует также словарь современного русского литературного языка, который издала еще Академия наук СССР . В словарь входят 120 480 слов, а состоит он из 17-ти томов. Слова, которые можно увидеть в этом словаре, относятся к литературной, художественной области, а используются в грамотной русской разговорной речи на радио, в школе, в печати и публицистике.

Многие другие существующие словари русского языка более конкретизированы («Словарь сокращений», «Словарь языка Пушкина» и т.д.), поэтому подсчитывать количество слов с их помощью было бы достаточно проблематично и неправильно.

(Фото: Atanas Bezov / Shutterstock.com)

Оказывается, на этот простой вопрос очень трудно дать какой-либо определенный ответ. И если еще можно разобраться с языком людоедского племени «Мумбо-Юмбо», который, как известно, включает ровно 300 слов, то с современными языками этот номер не пройдет. К каждому слову вопроса в заголовке статьи возникают, простите за тавтологию, вопросы.

Прежде всего, что считать словом? Мы привыкли, что слово - это совокупность букв между двумя пробелами. Но в языке гренландских эскимосов отдельные слова просто отсутствуют и каждое предложение можно считать отдельным словом. Да и в менее экзотических языках есть проблемы. Например, в чешском языке «не» с глаголами пишется слитно, в турецком отрицание вообще запрятано в центре слова, так что по нашим правилам каждое слово с отрицанием нужно считать отдельно.

И как в таком случае быть с окончаниями (большой, большая, большое) и омонимами (лук как растение и лук как оружие)? Можно ли считать отдельными словами сложносокращенные слова и аббревиатуры? Можно ли засчитать слово «кавеэнщик» или «замполит»? А пресловутое «замолаживать»? И в каждом языке таких подвохов десятки тысяч!

Еще более каверзные вопросы возникают по поводу того, что считать языком? Считать ли диалекты и говоры как отдельные языки или разновидности основного? Кстати, в Европе и Африке частенько случается, что и не сразу определишь, какой язык для диалекта является основным, до того все перепутано. А можно ли однозначно определить, к какому языку относится то или иное слово? Например, «хата» или «атаман» - это русские или украинские слова? Какому языку засчитывать слова «сервер», «сайт», «провайдер» - английскому, немецкому, русскому или всем сразу?

Поэтому ограничимся лишь отдельными прикидками, которые ни в коей мере не претендуют на какую-либо научную ценность, но может быть, окажутся познавательными.

Начнем, конечно же, с русского языка. Лингвисты утверждают, что в нем около 500000 слов, не считая специальных и научных терминов, которые удваивают это число. Конечно, среди этого невообразимого множества есть устаревшие, заимствованные и сложные слова, имеющие в своём составе не менее двух полнозначных основ, уменьшительные, ласкательные и прочие формы одного и того же исходного слова. Поэтому если же обратиться к самому авторитетному Большому академическому словарю в 17-ти томах, то окажется что в нем 131 257 слов. Но следует учесть, что вышел этот словарь в 1970 году и ничего не знает про перестройку, интернет и прочие радости современной жизни, а также про бытующие в сельской местности диалектные слова. Помните про «синенькие»?

Что касается английского языка, то по данным проекта Global Language Monitor, в середине 2009 года количество слов в нем превысило один миллион и продолжает расти со скоростью около 15 слов в день. Верить этому или нет - решайте сами, но миллионным стало слово «Web 2.0». Да-да, именно так - с циферками! Кроме того, среди зарегистрированных в этом списке слов можно найти 9/11, Obama, Vladimir Putin, H1N1, dot.com, Y2K, King of Pop, Same-sex marriage, Ho-Ho-Ho (традиционная фраза Санта Клауса) и даже =^..^= (котенок) и прочие смайлики! Интересно, что получится, если по таким же правилам учесть в русском языке все Фортинбрасы на Умслопогасе и РУ СК ГП МВД РФ? Но и по словарям английский язык выигрывает вчистую. Так, в третьем издании Вебстеровского словаря 450 тысяч слов, а в полном Оксфордском - около 500 тысяч.

Особняком стоят иероглифические языки, где каждый символ означает не букву, а целое слово. Здесь прямые сравнения и вовсе невозможны. Если же смотреть по словарям, то такие языки сильно проигрывают. Наиболее полный японский словарь содержит 50000 иероглифов. При этом министерство просвещения Японии определило для повседневного использования только 1850 иероглифов. В китайском языке общее количество иероглифов побольше - около 80 тысяч. Но и здесь реально используется много меньше. Так, принятый в 1981 году государственный стандарт «Основной набор иероглифов, закодированных для использования в ЭВМ» включает 6763 иероглифа.

Однако формальным победителем является итальянский язык. У итальянцев все составные числительные прописью пишутся слитно, в одно слово. А так как ряд чисел бесконечен, то бесконечно и количество слов итальянского языка. Нокаут!