2015-06-11

The EDICT Dictionary File

http://www.edrdg.org/jmdict/edict.html
EDICT is a Japanese-English Dictionary file.
和英辞典ファイルのダウンロード。
漢字の辞書もある。

KANJIDIC2 HOME PAGE

http://www.edrdg.org/kanjidic/kanjd2index.html
The KANJIDIC2 project has as its aim the production of a consolidated XML-format kanji database combining the information currently in the KANJIDIC (6,355 kanji from JIS X 0208) and KANJD212 (5,801 kanji from JIS X 0212) files (overview) (documentation), and adding information about the additional 952 kanji in JIS X 0213. (2,743 kanji are in both JIS X 0212 and JIS X 0213.)
漢字とその意味(英語)の辞書。

2015-06-09

Chainer: A flexible framework of neural networks

http://chainer.org/
A Powerful, Flexible, and Intuitive Framework of Neural Networks
ライセンスは MIT License。

Deep Learning のフレームワーク Chainer を公開しました | Preferred Research

http://research.preferred.jp/2015/06/deep-learning-chainer/
本日、Deep Learning の新しいフレームワークである Chainer を公開しました。

Chainer は、ニューラルネットを誤差逆伝播法で学習するためのフレームワークです。以下のような特徴を持っています。

* Python のライブラリとして提供(要 Python 2.7+)
* あらゆるニューラルネットの構造に柔軟に対応
* 動的な計算グラフ構築による直感的なコード
* GPU をサポートし、複数 GPU をつかった学習も直感的に記述可能

2015-06-08

生態学/非統計系向け確率的トピックモデル講義録

http://chasen.org/~daiti-m/diary/?201506a&to=201506070#201506070
今年の1月に統数研で行われた, 「生物に見られる時空間パターンと統計数理:同調・認知・行動」 という島谷先生主催の研究集会で行ったトピックモデルの講義を, 何と聴いていた学生 さん・若手の方と島谷さんが文字起こしした上で, 編集して講義録として公開してくれました。

「離散データの確率的トピックモデル」
http://chasen.org/~daiti-m/paper/daichi15topicmodel-for-ecology.pdf

2015-06-04

Variant tf-idf functions | Introduction to Information Retrieval

http://nlp.stanford.edu/IR-book/html/htmledition/variant-tf-idf-functions-1.html
For assigning a weight for each term in each document, a number of alternatives to tf and tf-idf have been considered.

livedoor ニュースコーパス | ダウンロード | 株式会社ロンウイット

http://www.rondhuit.com/download.html#ldcc
概要
本コーパスは、NHN Japan株式会社が運営する「livedoor ニュース」のうち、下記のクリエイティブ・コモンズライセンスが適用されるニュース記事を収集し、可能な限りHTMLタグを取り除いて作成したものです。

収集時期:2012年9月上旬 ダウンロード(通常テキスト):ldcc-20140209.tar.gz ダウンロード(Apache Solr向き):livedoor-news-data.tar.gz 論文などで引用する場合は、このURLを参照してください。