Полноразмерный словарь / тезаурус

Я нахожусь на ранних этапах разработки серии простых игровых игр, которые, я надеюсь, помогут мне выучить новые слова. Важнейшая часть идей, которые у меня есть, – полностью понятный словарь; Я хочу, чтобы иметь возможность использовать регулярные выражения для поиска словаря для заданных слов и извлечения некоторых других битов информации (например, определение, тип (существительное / глагол …), синонимы, антонимы, цитаты, демонстрирующие используемое слово и т. Д.) , В настоящее время у меня есть Wordbook (mac app), который я нахожу в порядке, но не понял, могу ли я его проанализировать с помощью скрипта python. Я предполагаю, что не могу, и задавался вопросом, знает ли кто-нибудь разумный словарь, который позволит это. В идеале я бы сделал все это независимо от Интернета.

благодаря

  • Сглаживание общего JSON Список диктов или списков в Python
  • Тернарное выражение в понимании словаря
  • Как «отлично» переопределить dict?
  • и {} vs list () и dict (), что лучше?
  • Словарь Python vs list, который быстрее?
  • Добавление словаря в список в aa loop Python
  • Объединение 2 файлов csv
  • Python эквивалент PHP () и extract ()
  • Упорядоченный словарь в Python
  • Пересечение двух словарей в Python
  • Как это сделать - трассировка и поиск словаря python
  • как добавить выбранные файлы из диалогового окна в словарь?
  • 3 Solutions collect form web for “Полноразмерный словарь / тезаурус”

    Nltk wordnet corpus обеспечивает программный интерфейс для «большой лексической базы данных английских слов». Вы можете перемещаться по графику слов на основе различных отношений. Он соответствует требованиям для показа «определения, части речи, синонимов, антонимов, кавычек» и «из словаря, который идеально загружаем».

    Другим вариантом было бы загрузить недавний снимок данных Викисловаря и проанализировать его в формате, который вы можете использовать, но это может быть немного задействовано ( если не существует достойного анализатора викторийских Python ).

    Вот пример печати некоторых атрибутов с помощью Wordnet:

    import textwrap from nltk.corpus import wordnet as wn POS = { 'v': 'verb', 'a': 'adjective', 's': 'satellite adjective', 'n': 'noun', 'r': 'adverb'} def info(word, pos=None): for i, syn in enumerate(wn.synsets(word, pos)): syns = [n.replace('_', ' ') for n in syn.lemma_names] ants = [a for m in syn.lemmas for a in m.antonyms()] ind = ' '*12 defn= textwrap.wrap(syn.definition, 64) print 'sense %d (%s)' % (i + 1, POS[syn.pos]) print 'definition: ' + ('\n' + ind).join(defn) print ' synonyms:', ', '.join(syns) if ants: print ' antonyms:', ', '.join(a.name for a in ants) if syn.examples: print ' examples: ' + ('\n' + ind).join(syn.examples) print info('near') 

    Вывод:

     sense 1 (verb) definition: move towards synonyms: approach, near, come on, go up, draw near, draw close, come near examples: We were approaching our destination They are drawing near The enemy army came nearer and nearer sense 2 (adjective) definition: not far distant in time or space or degree or circumstances synonyms: near, close, nigh antonyms: far examples: near neighbors in the near future they are near equals ... 

    Wordnik имеет API Python

    Насколько мне известно, dictionary.com предлагает бесплатный API для некоммерческого использования здесь . Возможно, вы сможете извлечь некоторые данные из Интернета.

    Python - лучший язык программирования в мире.