2017年6月の記事一覧

推薦システムの基本的な評価指標について整理してみた

はじめまして、データサイエンスチームの t2sy です。 私が所属しているデータサイエンスチームでは、Python・Rなどを用いてデータ分析を行っています。また、Apache Sparkを用いた機械学習基盤を開発しており、中でも推薦システムでは、購買などの周期性を考慮した行列分解手法による推薦アルゴリズムを実装した新機能を近日リリース予定です。 この記事では、推薦システムの開発で用いている以下の基本的な評価指標につい…
 
続きを読む

Lake Suigetsuの奇跡に触れる

教科書に載る湖 福井県の若狭湾に水月湖という湖が有ります。三方五湖の一つといえば、ピンと来るでしょうか。その水月湖が、2016年から中学校の理科、社会、数学、国語の教科書に掲載されるようになったのをご存知でしょうか? 私の周辺ではあまり知っている者が居ませんでしたが、ある業界では世界でもっとも有名な場所なのです。   どの業界なのか、そして何故有名になったかを説明するため、ちょっと横道に逸れるのをお許しくだ…
 
続きを読む

「原因と結果」

はじめまして、データサイエンスチームの山川です。 最近、経済学のジャンルでベストセラーになっている「原因と結果」の経済学―――データから真実を見抜く思考法と言う本を読みました。 この本では、一言で言えば「相関関係があるからといって因果関係が有るとは限らない」ということを述べています。   例えば、「はじめに」の一番最初に以下のようなグラフを示しています。これは、小学生のある時点における学力テストの正答率と、…
 
続きを読む