EDICT is a Japanese-English Dictionary file.和英辞典ファイルのダウンロード。
漢字の辞書もある。
EDICT is a Japanese-English Dictionary file.和英辞典ファイルのダウンロード。
The KANJIDIC2 project has as its aim the production of a consolidated XML-format kanji database combining the information currently in the KANJIDIC (6,355 kanji from JIS X 0208) and KANJD212 (5,801 kanji from JIS X 0212) files (overview) (documentation), and adding information about the additional 952 kanji in JIS X 0213. (2,743 kanji are in both JIS X 0212 and JIS X 0213.)漢字とその意味(英語)の辞書。
A Powerful, Flexible, and Intuitive Framework of Neural Networksライセンスは MIT License。
本日、Deep Learning の新しいフレームワークである Chainer を公開しました。
Chainer は、ニューラルネットを誤差逆伝播法で学習するためのフレームワークです。以下のような特徴を持っています。
* Python のライブラリとして提供(要 Python 2.7+)
* あらゆるニューラルネットの構造に柔軟に対応
* 動的な計算グラフ構築による直感的なコード
* GPU をサポートし、複数 GPU をつかった学習も直感的に記述可能
今年の1月に統数研で行われた, 「生物に見られる時空間パターンと統計数理:同調・認知・行動」 という島谷先生主催の研究集会で行ったトピックモデルの講義を, 何と聴いていた学生 さん・若手の方と島谷さんが文字起こしした上で, 編集して講義録として公開してくれました。
「離散データの確率的トピックモデル」
http://chasen.org/~daiti-m/paper/daichi15topicmodel-for-ecology.pdf
For assigning a weight for each term in each document, a number of alternatives to tf and tf-idf have been considered.
概要
本コーパスは、NHN Japan株式会社が運営する「livedoor ニュース」のうち、下記のクリエイティブ・コモンズライセンスが適用されるニュース記事を収集し、可能な限りHTMLタグを取り除いて作成したものです。
収集時期:2012年9月上旬 ダウンロード(通常テキスト):ldcc-20140209.tar.gz ダウンロード(Apache Solr向き):livedoor-news-data.tar.gz 論文などで引用する場合は、このURLを参照してください。
概要
本コーパスは,Twitterからランダムにサンプリングしたテキストに現れる,「特定の場所を著者が想定している」と判断できる表現に対して,実際にどのエンティティを指しているかを人手で判断しエンティティ情報を付与したコーパスです.GeoNLPなどのジオパーズシステム,エンティティリンキングシステム等の開発や評価に利用することを想定して構築されました.
United States Patent 9037464word2vec 関連の特許。
Inventors:
Mikolov, Tomas (Jersey City, NJ, US)
Chen, Kai (San Bruno, CA, US)
Corrado, Gregory S. (San Francisco, CA, US)
Dean, Jeffrey A. (Palo Alto, CA, US)
This demo trains a Convolutional Neural Network on the MNIST digits dataset in your browser, with nothing but Javascript.手書き数字の画像データを JavaScript のプログラムで学習するデモ。
We'll train RNNs to generate text character by character and ponder the question "how is that even possible?"
ConvNetJS is a Javascript implementation of Neural networks, together with nice browser-based demos.
ConvNetJS is a Javascript library for training Deep Learning models (mainly Neural Networks) entirely in your browser. Open a tab and you're training. No software requirements, no compilers, no installations, no GPUs, no sweat.
GloVe is an unsupervised learning algorithm for obtaining vector representations for words. Training is performed on aggregated global word-word co-occurrence statistics from a corpus, and the resulting representations showcase interesting linear substructures of the word vector space.
The echo state network (ESN) is a recurrent neural network with a sparsely connected hidden layer (with typically 1% connectivity). The connectivity and weights of hidden neurons are randomly assigned and are fixed. The weights of output neurons can be learned so that the network can (re)produce specific temporal patterns.
Reservoir computing is a framework for computation like a neural network.
This is a corrected version of the technical report H. Jaeger(2001): The ”echo state” approach to analysing and training recurrent neural networks. GMD Report 148, German National Research Center for Information Techno logy, 2001.