HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p>Любитель научной фантастики и технологического прогресса. Хорошо сочетает в себе заумного технаря и утончённого гуманитария. Пишет про IT и радуется этому.</p>
1 <p>Любитель научной фантастики и технологического прогресса. Хорошо сочетает в себе заумного технаря и утончённого гуманитария. Пишет про IT и радуется этому.</p>
2 <p>Задача Lingua проста: с её помощью можно определить, на каком языке написан входной текст, причём для анализа хватает одного слова. Это может быть полезно для классификации текста или проверки на орфографию.</p>
2 <p>Задача Lingua проста: с её помощью можно определить, на каком языке написан входной текст, причём для анализа хватает одного слова. Это может быть полезно для классификации текста или проверки на орфографию.</p>
3 <p>Обычно определение языка происходит при помощи фреймворков машинного обучения или<a>NLP-приложений</a>. Чтобы не разбираться в специфике системы и её функционировании, разработчики предлагают уже готовые решения, такие как библиотека Lingua.</p>
3 <p>Обычно определение языка происходит при помощи фреймворков машинного обучения или<a>NLP-приложений</a>. Чтобы не разбираться в специфике системы и её функционировании, разработчики предлагают уже готовые решения, такие как библиотека Lingua.</p>
4 <p>Сейчас она поддерживает 75 языков, и их количество постепенно растёт. Среди них есть и популярные - английский, испанский и русский, - и те, что используются гораздо реже, - коса, урду и тамил.</p>
4 <p>Сейчас она поддерживает 75 языков, и их количество постепенно растёт. Среди них есть и популярные - английский, испанский и русский, - и те, что используются гораздо реже, - коса, урду и тамил.</p>
5 <p>Разработчик Lingua смог решить серьёзные недостатки таких библиотек, как<a>CLD 2</a>,<a>CLD 3</a>,<a>langid</a>и <a>langdetect</a>. Все они, за исключением двух последних, имели следующие проблемы:</p>
5 <p>Разработчик Lingua смог решить серьёзные недостатки таких библиотек, как<a>CLD 2</a>,<a>CLD 3</a>,<a>langid</a>и <a>langdetect</a>. Все они, за исключением двух последних, имели следующие проблемы:</p>
6 <ul><li>они работали только на больших фрагментах текста, а для коротких (например, пост в Twitter) они не выдавали адекватных результатов;</li>
6 <ul><li>они работали только на больших фрагментах текста, а для коротких (например, пост в Twitter) они не выдавали адекватных результатов;</li>
7 <li>чем больше языков присутствовало в тексте, тем менее точным был результат.</li>
7 <li>чем больше языков присутствовало в тексте, тем менее точным был результат.</li>
8 </ul><p>Lingua направлена на решение этих проблем. Она почти не требует предварительной настройки и выдаёт относительно точные результаты при работе с текстами любого объёма - от отдельных слов до длинных статей. Кроме того, библиотеке не нужны дополнительные словари или внешние API. Lingua можно использовать сразу же после загрузки - причём даже без интернета.</p>
8 </ul><p>Lingua направлена на решение этих проблем. Она почти не требует предварительной настройки и выдаёт относительно точные результаты при работе с текстами любого объёма - от отдельных слов до длинных статей. Кроме того, библиотеке не нужны дополнительные словари или внешние API. Lingua можно использовать сразу же после загрузки - причём даже без интернета.</p>
9 Средняя точность библиотек. Источник:<a>Github</a><p>Подробнее с библиотекой можно познакомиться на <a>Github-странице разработчика</a>.</p>
9 Средняя точность библиотек. Источник:<a>Github</a><p>Подробнее с библиотекой можно познакомиться на <a>Github-странице разработчика</a>.</p>
10 <p>Вот как на это отреагировали пользователи<a>Reddit</a>:</p>
10 <p>Вот как на это отреагировали пользователи<a>Reddit</a>:</p>
11 <p>“Звучит очень изящно”.</p>
11 <p>“Звучит очень изящно”.</p>
12 Скриншот:<a>Reddit</a><p>“Мне это нравится”.</p>
12 Скриншот:<a>Reddit</a><p>“Мне это нравится”.</p>
13 Скриншот:<a>Reddit</a><p>“Она, наверное, будет хорошо работать вместе с argos-translate”.</p>
13 Скриншот:<a>Reddit</a><p>“Она, наверное, будет хорошо работать вместе с argos-translate”.</p>
14 Скриншот:<a>Reddit</a><a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>
14 Скриншот:<a>Reddit</a><a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>