RStudioを用いた解析フローの共通基盤構築の研究 (統計数理研究所2017年度共同研究)

ホーム / MyResearch / RStudioを用いた解析フローの共通基盤構築の研究 (統計数理研究所2017年度共同研究)

統計数理研究所平成29(2017)年度共同研究として採択された「RStudioを用いた解析フローの共通基盤構築の研究 」

  • 研究概要・目的
    • 研究概要
      RStudioを用いた解析フローの共通基盤構築に関する研究を行う.
      また,RやRStudioでのビッグデータ分析フローについて整備してデータサイエンス分野の先端的研究のオープン化について検討する.
    • 研究目的
  • ビッグデータ分析が当たり前のように実施され,さまざまな分析環境が提案されている.しかし,これらでは,分析プロセスはブラックボックスとされ,結果のみが強調される場合が多い.日本においてもデータサイエンスの領域は期待が高くなっており,データに基づいてモデルを構築する統計的なビッグデータ解析が必須となっている.統計的なビッグデータ分析環境としては多くの研究者による検証が必須である.そこで,グローバルなデータ分析環境としてオープンソースソフトウェアのRとその解析(開発)環境であるRStudioに注目し,解析フローの記述に関する共通基盤構築について検討する.
  • 特に,日本のみならず,RStudioの研究者との共同研究をも通じ,日本のデータサイエンス関係の研究者間で今後有効に利用されるための,解析フローの記述に関する基盤構築のための共通化について研究する.

共同研究参加者
今泉 忠 多摩大学
飯塚 誠也 岡山大学
大草 孝介 九州大学
Kuhn Max RStudio Inc.
久保田 貴文 多摩大学
酒折 文武 中央大学
水田 正弘 北海道大学
宿久 洋 同志社大学
山本 義郎 東海大学
藤野 友和 福岡女子大学

報告書innsatsu

  • 関連論文など

Max Kuhn: Adaptive Resampling in a Parallel World

Maron, O., & Moore, A. (1997). The Racing Algorithm: Model Selection for Lazy Learners. In D. Aha (Ed.), Lazy Learning (pp. 193-225). Springer Netherlands.

Shen, H., Welch, W. J., & Hughes-Oliver, J. M. (2011). Efficient, adaptive cross-validation for tuning and comparing models, with application to drug discovery. The Annals of Applied Statistics, 5(4), 2668–2687.