{NLP}特定の単語を含む一文を抽出する

O’reilly NTP with Pythonの演習問題1.8_17

環境等

  • win 10
  • python2.7
  • python lib: nltk.book

  • 関数index()

    index()を使って特定単語の添字を求めたあと、前後の「.」までの単語を一文とみなし、出力します。
    色々な方法があると思います。これで最適なのかわかりませんが……。
    ここではtext9(‘The Man Who Was Thursday’by G . K . Chesterton 1908)から、’sunset’を含む一文を抽出してみます。

    出力結果:

    CHAPTER I THE TWO POETS OF SAFFRON PARK THE suburb of Saffron Park lay on the sunset side of London , as red and ragged as a cloud of sunset.

    Leave a Reply

    Your email address will not be published. Required fields are marked *