2017-08-15

JSON Streaming - Wikipedia

https://en.wikipedia.org/wiki/JSON_Streaming
Line delimited JSON (LDJSON), newline delimited JSON (NDJSON), and JSON lines (JSONL) are three terms for equivalent formats of JSON streaming.

2017-05-19

ndjson

http://ndjson.org/
This page describes the ndjson format, also called Newline delimited JSON.
NDJSON is a convenient format for storing or streaming structured data that may be processed one record at a time.
http://specs.okfnlabs.org/ndjson/
NDJSON - Newline delimited JSON
1行 1 JSON のデータフォーマットに「ndjson」という名前が付いていたのを初めて知った。

2017-04-26

「統計数理」第64巻

http://www.ism.ac.jp/editsec/toukei/tokeisuri-64j.html#NO2
特集「統計的言語研究の現在」

「特集 統計的言語研究の現在」編集にあたって
持橋 大地、前川 喜久雄、浅原 正幸

文に隠れた構文構造を発見する統計モデル
能地 宏

言語変化と系統への統計的アプローチ
村脇 有吾

条件付き確率場の理論と実践
岡崎 直観

言語理解研究における眼球運動データ及び読み時間データの統計分析
新井 学、Douglas Roland

ツイート数と現実の統計量との差異に関する検討
荒牧 英治、若宮 翔子
全文 pdf をダウンロードできる。

2017-03-20

models/skip_thoughts at master · tensorflow/models · GitHub

https://github.com/tensorflow/models/tree/master/skip_thoughts
Skip-Thought Vectors

This is a TensorFlow implementation of the model described in:

Jamie Ryan Kiros, Yukun Zhu, Ruslan Salakhutdinov, Richard S. Zemel, Antonio Torralba, Raquel Urtasun, Sanja Fidler. Skip-Thought Vectors. In NIPS, 2015.

著作物が自由に使える場合は? | 著作権って何? | 著作権Q&A | 公益社団法人著作権情報センター CRIC

http://www.cric.or.jp/qa/hajime/hajime7.html
インターネット情報検索サービスにおける複製(著作権法第47条の6)
インターネットによる情報検索サービスを行う事業者は、当該サービスを提供するために必要と認められる限度において、著作物を複製・自動公衆送信することができる。但し、著作権者が情報収集されることを拒否している場合は当該情報は収集できず、また、違法著作物であることを知った場合には、その提供を停止しなければならない。
情報解析のための複製(著作権法第47条の7)
コンピュータを使った情報解析のために、必要と認められる限度において、著作物を複製することができる。

2017-03-19

GitHub - google/seq2seq: A general-purpose encoder-decoder framework for Tensorflow

https://github.com/google/seq2seq
A general-purpose encoder-decoder framework for Tensorflow that can be used for Machine Translation, Text Summarization, Conversational Modeling, Image Captioning, and more.

DotNetZip/CRC32.cs at master · HalfVoxel/DotNetZip · GitHub

https://github.com/HalfVoxel/DotNetZip/blob/master/CommonSrc/CRC32.cs
// This code is licensed under the Microsoft Public License.
// See the file License.txt for the license details.
// More info on: http://dotnetzip.codeplex.com
ファイルの CRC32 を計算する C# ソースコード。

Create an offline installer for Visual Studio 2017 | Microsoft Docs

https://docs.microsoft.com/en-us/visualstudio/install/create-an-offline-installation-of-visual-studio
For Visual Studio Community, run:
vs_community.exe --layout c:\vs2017offline
To download all workloads and components for only one language, run:
vs_enterprise.exe --layout C:\vs2017offline --lang en-US

2017-03-13

GitHub - google/sentencepiece

https://github.com/google/sentencepiece
SentencePiece is an unsupervised text tokenizer and detokenizer mainly for Neural Network-based text generation systems where the vocabulary size is predetermined prior to the neural model training.
SentencePiece implements sub-word units (also known as wordpieces [Wu et al.] [Schuster et al.] and byte-pair-encoding (BPE) [Sennrich et al.]) with the extension of direct training from raw sentences.

2016-11-12

[1611.01505] Improving Stochastic Gradient Descent with Feedback

https://arxiv.org/abs/1611.01505
We conduct experiments to compare the resulting algorithm, which we call Eve
勾配降下法の最適化アルゴリズム「Eve optimizer」の提案。

https://github.com/jayanthkoushik/sgd-feedback/blob/master/src/eve.py

著者による実装。

2016-10-29

福島邦彦: Deep CNN ネオコグニトロンの学習

https://kaigi.org/jsai/webprogram/2016/pdf/130.pdf
最近のネオコグニトロンでは,中間層のS 細胞の学習に,Add-if-Silent (AiS) と名付けた学習則を用いている.この学習則は,S 細胞の入力結合の強度を定めるだけでなく,細胞そのものの発生も制御している.

Performance Benefits of Half Precision Floats | Intel® Software

https://software.intel.com/en-us/articles/performance-benefits-of-half-precision-floats/
3.2. Results

Using half-floats provides a performance benefit over 32-bit floats when 32-bit float data does not fit into the L1 cache. Specifically, half-floats provide an average speedup of 1.05x when 32-bit data would fit in the L2 cache, an average speedup of 1.3x when 32-bit data would fit in the L3 cache, and an average speedup of 1.6x when the 32-bit data would fit into memory. Additionally, while half-floats may not provide a direct performance benefit when 32-bit data would fit into the L1 cache, you may still experience an auxiliary benefit when using half-floats in your program because half-floats will use half as much space, which allows for significantly more of your programs data to reside in L1.
half-float (FP16) を使えば、使用するメモリがCPUのキャッシュに載らない場合では 1.6倍くらい高速化できるらしい。

Intel Intrinsics Guide

https://software.intel.com/sites/landingpage/IntrinsicsGuide/
The Intel Intrinsics Guide is an interactive reference tool for Intel intrinsic instructions, which are C style functions that provide access to many Intel instructions - including Intel® SSE, AVX, AVX-512, and more - without the need to write assembly code.

2016-07-09

t-SNE – Laurens van der Maaten

https://lvdmaaten.github.io/tsne/
t-Distributed Stochastic Neighbor Embedding (t-SNE) is a (prize-winning) technique for dimensionality reduction that is particularly well suited for the visualization of high-dimensional datasets.
次元圧縮(次元削減)の機械学習アルゴリズム。
このアルゴリズムを使えば、高次元データを2次元空間にプロットして可視化できる。
JavaScript などの実装もある。

plotly.js | JavaScript Graphing Library

https://plot.ly/javascript/
Built on top of d3.js and stack.gl, plotly.js is a high-level, declarative charting library. plotly.js ships with 20 chart types, including 3D charts, statistical graphs, and SVG maps.

2016-06-17

シモセラ・エドガー ラフスケッチの自動線画化

http://hi.cs.waseda.ac.jp/~esimo/ja/research/sketch/
本研究では、畳込みニューラルネットワークを用いてラフスケッチを線画に自動変換する手法を提案する。
Learning to Simplify: Fully Convolutional Networks for Rough Sketch Cleanup
Edgar Simo-Serra*, Satoshi Iizuka*, Kazuma Sasaki, Hiroshi Ishikawa (* equal contribution)
ACM Transactions on Graphics (SIGGRAPH), 2016

2016-06-09

【人工知能はいま 専門家に学ぶ】(6)日本を代表する数理工学者、合原一幸氏が見るAIの世界 (1/5ページ) - SankeiBiz(サンケイビズ):

http://www.sankeibiz.jp/aireport/news/160605/aia1606050700001-n1.htm
今ではニューロモーフィックハードウェアと呼ばれる分野で、脳のニューロンとシナプスを物理的に摸して、神経回路のように動作する電子回路の研究です。現在あるコンピュータのほぼすべてはフォン・ノイマン型と呼ばれるコンピュータアーキテクチャですが、それとは全く違ったアーキテクチャで、超低消費電力かつ高性能を実現するものです。