事例

事例1:AIを用いた部材品質不良の検出

畳込ニューラルネットワークを用いて、部材の品質不良を分類検知する高性能なアルゴリズムを開発した。学習環境ではKerasを用いてモデルを作成した。高速性が求められる運用環境では前記モデルをTensorFlow(C++呼出し)で利用する構成とした。

  • データ規模:画像データ100枚
  • データ:bmp形式
  • 言語:Python、C++言語
  • 期間:12ヶ月
  • 作業場所:SOHO

 

事例2:AIを用いた部品品質不良の検出

畳込ニューラルネットワークを用いて、部品の外観不良を分類検知する高性能なアルゴリズムを開発した。Caffeフレームワークを用いて学習と認識処理を実施した。

  • データ規模:画像データ350枚
  • データ:pgm形式
  • 言語:Python言語
  • 期間:3ヶ月
  • 作業場所:SOHO

 

事例3:AI学習向け教示データ作成ツールの開発

ニューラルネットワークの教示用ビットマップ画像を効率的に作成する機能および大規模な画像ファイルを比較閲覧可能な画像ビューワ機能を具備したツールを開発した。

  • データ規模:画像データ1000枚
  • データ:jpg形式
  • 言語:C++言語、Qt環境
  • 期間:2ヶ月
  • 作業場所:SOHO

 

事例4:独自DNNフレームワークの開発

多くのDNNフレームワークは、前処理である入力画像の準備に煩雑なプログラミングが必要となることが多く、初心者には敷居が高いという課題を抱えている。この前処理部分を独自にフレームワーク化することで、学習時の煩雑なプログラミングを排除することを可能にした。ニューラルネットワークのエンジンには、独自開発した高速3層NNエンジンやCaffeを利用できる。

  • データ規模:多量の画像データ
  • データ:各種画像形式
  • 言語:C++およびCUDA言語、CuBLAS環境
  • 期間:6ヶ月
  • 作業場所:SOHO

 

事例5:顧客データの分析

DBから抽出したデータから集計に必要なデータマートを作成した。顧客行動を行動履歴データから見える化し、コンバージョンに至る経路でボトルネックとなっているステップや、顧客のアクティブな活動状態の分布を明らかにした。

  • データ規模:約4,000名分。関連テーブル5個
  • データ:Oracle DB
  • 言語:R言語
  • 期間:1ヶ月
  • 作業場所:オンサイト

 

事例6:医療系データの集計

過去論文から集計方法を読み解いて直近3年間のデータを用いて同様の集計を実施した。大量データからSQL文とワークテーブルを使ってデータマートを作成し集計を行い、 R言語でグラフ描画、Open officeで資料形式にまとめた。大量データを取扱う際には相応のDB設定や、長時間に渡る集計処理になるため、計算時間の見積り及び途中からでも再計算できるように留意する必要があった。

  • データ規模:約1,200,000名分。関連テーブル4個
  • データ:SQL Server
  • 言語:SQL、R言語、Open office
  • 期間:2ヶ月
  • 作業場所:オンサイト

 

事例7:顧客のペルソナ分析

購買履歴情報からペルソナ分析(クラスタ分析、t検定、ロジスティック回帰、及びバスケット分析)を実施し、ロイヤルティを高めるための施策立案に必要な情報をまとめた。

  • データ規模:ユーザ数50,000名、トランザクション5,000万件
  • データ:CSV形式
  • 言語:R言語、Open office
  • 期間:1ヶ月
  • 作業場所:オンサイト

 

事例8:情報収集Webスパイダリング

RCurlパッケージを使用して、全国に点在するWebサイトから特定のページ情報を収集するプログラム開発を雛形をベースに行った。「多様なサーバ、複数の漢字コード、リダイレクト処理、Cookie情報、セッション情報、リファラー情報、ページ遷移制御、検索機能制御、及び詳細情報の取得」への対応を考慮する必要があった。

  • データ規模:Webサイト10件(計約5,000ページ)
  • データ:Webサーバ(コンテンツ)
  • 言語:R言語
  • 期間:2ヶ月
  • 作業場所:SOHO

 

事例9:Splunkを用いたSIEM基盤の構築

 SIEM基盤としてSplunkを導入(設計・構築)。種々サーバログやセキュリティ機器のログを統合管理するインフラを構築し、統合ログを分析することでインシデントを検知する仕組みを構築した。

  • データ規模:20GB/日
  • データ:種々サーバログ(webログ、syslog等)、セキュリティ機器のログ
  • 言語:SPL言語
  • 期間:5ヶ月
  • 作業場所:オンサイト・SOHO

 

事例10:PAI競馬予測サイト(自社運営サービス)の構築

2つの異なるアルゴリズムによる競馬予測エンジンを開発し、Webによる情報提供サービス(PAI競馬予測サイト)を構築した。

  • データ規模:約4,500レース/年
  • データ:MySQL
  • 言語:R言語、Python言語、C++言語
  • 期間:予測エンジン開発4年、Webサイト構築2ヶ月
  • 作業場所:SOHO