「機械学習」に関する記事一覧

Pythonで、時系列データをクラスタリングしてみよう

こんにちは。データサイエンスチームのHan-Cheolです。 この記事は、DataScience Advent Calendarの12日目の記事です。 1. はじめに 実世界のデータの多くは時間と共に変化する情報、つまり時系列データです。私たちの周辺に目を向けてみると、ウェブサイトに訪れるユーザーの行動データや消費電力データなど、身近なところでもすぐ見つけることが可能です。 今回は、「クラスタリング」手法を利用して「…
 
続きを読む

「21世紀の相関係数」を超える

この記事は#DataScience by DATAHOTEL Tech blog Advent Calendar 2017の10日目の記事です. はじめに 我々のチームでは,データを分析するために色々な機械学習の手法を使っています. この記事では教師無し機械学習と呼ばれるデータマイニング手法を取り上げます.すなわち,教師データ(ラベル付きデータ)が無くても,データから何かのパターンや特徴を読み取る手法で,クラスタリン…
 
続きを読む

Amazon Rekognition Videoを使ってみた(AWS CLI/SDK版もあるよ!)

 こんにちは。データサイエンスチーム tmtk です。  この記事では、先日のAWS re:Invent 2017で発表された、Amazon Rekognition Videoの使い方をご紹介します。  この記事は、#DataScience by NHN Techorus DATAHOTEL Tech Blog Advent Calendar 2017 9日目の記事です。 Amazon Rekognition Vid…
 
続きを読む

口コミデータを活用したレコメンドシステムの可能性

はじめに アマゾンや楽天をはじめとするネット通販は現代人の生活にとって欠かせない存在になってきました。このようなe-コマースサービスでは、顧客満足度の向上と売上の増加という2つの目標を達成するために「 レコメンドシステム」を活用することが一般的です。 レコメンドシステムはその手法によって下記の2種類に分類することが可能です。 購買パターンが類似する顧客の情報を利用する「協調フィルタリング」 商品の情報を利用する「コン…
 
続きを読む

ディープラーニング入門:Kerasで簡単画像認識

 こんにちは。データサイエンスチーム tmtkです。  この記事では、ディープラーニングを使ってみる手順を紹介します。  この記事は、DataScience Advent Calendar 6日目の記事です。 この記事でやること  この記事では、次の写真に何が写っているのかディープラーニングで判定し、 と出力させてみる手順を紹介します。 環境構築  まず、Ubuntu 16.04をインストールしたコンピュータを用意し…
 
続きを読む

ビッグデータの人気イベントCloudera World Tokyo 2017に行ってきた

はじめまして、NHNテコラス データサイエンスチームのtocci3です。 音楽(クラシック、チェロ、HR/HM)と健康関連(筋トレ、糖質制限)と開発全般と機械学習・ビッグデータ界隈に興味があります。 先日行ってきた、ビッグデータの人気イベント Cloudera World Tokyo 2017 についての参加レポートです。 内容が多いため、基本的に参加したセッションの箇条書きのメモと、その他スライドとなります。 雰囲…
 
続きを読む

データサイエンス関連参加イベントまとめ(2017年)【後半】

この記事は#DataScience by DATAHOTEL Tech blog Advent Calendar 2017の二日目の記事です. データサイエンス関連参加イベントまとめ(2017年)【前半】にて,今年参加したイベントのリストを作成しました. 後半では,リストを手動クラスタリングして内容について考察したいと思います. 2017年はどんなイベントに注目したのか AI(人工知能)/機械学習 オープンソース技術…
 
続きを読む

データサイエンス関連参加イベントまとめ(2017年)【前半】

DataScience Advent Calendarのはじめに、今年我々 NHNテコラス データサイエンスチームが参加/登壇した データサイエンス(機械学習(ML)、AI(人工知能)、IoT、ビッグデータ、情報工学、数学、統計、AWS、ディープラーニング、BI、データ分析)関連のイベントを振り返ろうと思います。     Date Title Comment 01/10 産総研人工知能セミナー第1…
 
続きを読む

スペクトラルクラスタリング入門

こんにちは、データサイエンスチーム tmtkです。 この記事では、スペクトラルクラスタリング(Spectral Clustering)について説明します。スペクトラルクラスタリングについて、具体的には、 スペクトラルクラスタリングとは 行列の固有値分解によるグラフの連結成分分解の説明 スペクトラルクラスタリングのアルゴリズムと計算例 関連する話題 を説明します。 スペクトラルクラスタリングとは スペクトラルクラスタリ…
 
続きを読む

機械学習 オーバーフィッティング(過学習)について

お久しぶりです。橘です。 引き続き、機械学習について書いていきます。 前回、「次回は最尤推定法」という風にお伝えしましたが、要望があったことと「機械学習の弱点」は先におさえておくべきと考え、「オーバーフィッティング(過学習)」についてお話します。 オーバーフィッティングについて 機械学習 曲線フィッティングについて 後編 の記事でも少し触れましたが、オーバーフィッティングとは 「学習データには適合するけど、新たなデー…
 
続きを読む