国立大学法人 京都大学 宇宙総合学研究ユニット
-
業種
研究・教育
-
課題・要望
短期間の実習講座に合わせて 迅速・低コストでデータ解析環境を構築
-
製品・サービス
クラウド
- クラウド
- 研究・教育
- コスト削減
国立大学法人 京都大学には、理工系から人文社会系まで様々な分野の研究者が集まって、宇宙とそこに住む人類のことを総合的に研究する「宇宙総合学研究ユニット」という組織がある。同ユニットでは、文理融合の人材育成を目的として1週間の実習型スキル向上プログラム「ビッグデータ解析実習 2014」を開講。そのデータ解析実習環境として、アマゾンウェブサービス(以下、AWS)が提供する「Amazon Elastic MapReduce」(以下、Amazon EMR)を採用した。
高等教育に AWSのクラウドサービスを活用―
実習型スキル向上プログラム「ビッグデータ解析実習」を実施し、文理融合型の人材育成を推進
文理融合の人材育成に取り組む宇宙総合学研究ユニット
京都大学 宇宙総合学研究ユニット
副ユニット長
京都大学大学院理学研究科付属天文台
教授・台長
柴田 一成 氏
京都大学 宇宙総合学研究ユニットは、幅広い分野の研究者を擁する総合大学としての京都大学の強みを活かし、宇宙理工学に関する基礎研究と融合領域の学問の開拓を目的に2008年4月より発足した、部局横断型の組織である。同ユニットの大きなミッションの一つは、宇宙科学とコンピュータ科学、人文・社会科学の知見を融合することで新たな学問領域「宇宙総合学」を開拓することにある。副ユニット長
京都大学大学院理学研究科付属天文台
教授・台長
柴田 一成 氏
同ユニット副ユニット長で京都大学大学院理学研究科附属天文台 教授・台長の柴田 一成 氏は、宇宙科学とコンピュータ科学、人文・社会科学の知見を融合することによって、新たな知の地平を開拓することが同ユニットの使命であると説明する。「例えば、宇宙ステーションの 中では、人種や国籍、文化といったバックグラウンドの異なる宇宙飛行士が何人も共同生活していますが、人が活動するところには、政治、法律、経済、医療などの人間の営み、学問で言えば主に人文・社会科学に属するような問題が必ず生じます。今や宇宙研究は、理工系だけには留まらない、総合的なアプローチが必要な時代になりました」
そんな同ユニットが、もう一つの大きなミッションとして掲げるものに、文理融合型の教育カリキュラムに基づく新たな人材育成がある。 柴田教授は、「日本の大学教育の大きな弊害の一つに、文系と理系とのカリキュラムの断絶があります。しかし、『宇宙総合学』という新たな学問を開拓するためには、文系・理系の垣根を超えた、文理融合型の新しいカリキュラムを創り出すことが不可欠です」と力説する。
とりわけ同ユニットが、文理融合型の教育カリキュラムの中心として据えているのが、ビッグデータ解析の実践的スキルを身につけた人材の育成だ。「例えば、ソーシャルメディア内で生まれるデータや、IoTデバイスから刻々と生み出されるセンサーデータなど、世の中には、ほとんど活用されないままに、蓄積されているデータで溢れています。これらビッグデータを活用すれば、何か社会に役立つようなイノベーションを生み出すころができるのではないでしょうか。当ユニットでは、そうした新しい発想を育みつつ、そのアイデアを自ら具現化する、ビッグデータ解析の実践的スキルを身に着けることを主要な教育目標に据えました」と、柴田教授は語る。
ビッグデータ解析の実習環境としてAmazon EMRを採用
こうしたビジョンに基づき、同ユニットは、2014年11月に京都大学の大学院 修士課程の学生20名を対象に、1週間の実習型スキル向上プログラム「ビッグデータ解析実習 2014」を開講。twitterのツイートデータを用いた簡単な解析によって基礎を理解した後に、学生の関心に合わせて、太陽地球観測データ、文献アーカイブデータの中から分析データを選択し機械学習によって規則性を発見することを実習課題とした。
同ユニットでは、今回のデータ解析実習のための基盤構築を、ビッグデータ解析基盤の豊富な導入実績をもつブロードバンドタワーに依頼。ブロードバンドタワーは、実習環境としてAWSが提供するAmazon EMRを提案した。
Amazon EMRは、ビッグデータ解析の代表的プラットフォームであるHadoopをAWSのクラウド内で利用可能にするウェブサービスだ。Amazon EMRでは、ユーザが指定した台数分、クラスタを自動でセットアップすることによってHadoopの分散処理フレームワークであるMapReduceの実行基盤を提供。これらHadoop/MapReduceを利用した強力な分散処理システムがAWSのクラウド内で利用可能になるだけでなく、AWSの仮想クラウドサーバ Amazon Elastic Compute Cloud(以下、Amazon EC2)やクラウドストレージAmazon Simple Storage Service(以下、Amazon S3)といった他のシステムとの連携も容易だ。
特に、ブロードバンドタワーが今回のビッグデータ解析実習の基盤としてAmazon EMRを提案したポイントは、20名分のビッグデータ解析実習環境を短期間の内に低コストで準備することができる点にある。今回のビッグデータ解析実習は、1週間という短期間の実習講座であり、実習期間終了後は、データ解析環境そのものが不要になる。AWSのクラウドサービスは、必要なときに必要な分だけコンピューティングリソースを調達でき、利用料金も使った分だけ支払うという従量課金であるため、今回の実習環境として最適であったのである。
同ユニットでは、今回のデータ解析実習のための基盤構築を、ビッグデータ解析基盤の豊富な導入実績をもつブロードバンドタワーに依頼。ブロードバンドタワーは、実習環境としてAWSが提供するAmazon EMRを提案した。
Amazon EMRは、ビッグデータ解析の代表的プラットフォームであるHadoopをAWSのクラウド内で利用可能にするウェブサービスだ。Amazon EMRでは、ユーザが指定した台数分、クラスタを自動でセットアップすることによってHadoopの分散処理フレームワークであるMapReduceの実行基盤を提供。これらHadoop/MapReduceを利用した強力な分散処理システムがAWSのクラウド内で利用可能になるだけでなく、AWSの仮想クラウドサーバ Amazon Elastic Compute Cloud(以下、Amazon EC2)やクラウドストレージAmazon Simple Storage Service(以下、Amazon S3)といった他のシステムとの連携も容易だ。
特に、ブロードバンドタワーが今回のビッグデータ解析実習の基盤としてAmazon EMRを提案したポイントは、20名分のビッグデータ解析実習環境を短期間の内に低コストで準備することができる点にある。今回のビッグデータ解析実習は、1週間という短期間の実習講座であり、実習期間終了後は、データ解析環境そのものが不要になる。AWSのクラウドサービスは、必要なときに必要な分だけコンピューティングリソースを調達でき、利用料金も使った分だけ支払うという従量課金であるため、今回の実習環境として最適であったのである。
AWSの分かりやすいユーザインターフェースによって、学生の積極的関与を引き出すことに成功
このようにAmazon EMRを解析環境として利用したビッグデータ解析実習は、1週間の集中講義を経て、無事に終了。柴田教授は、今回の実習は、正規の単位取得コースの講座ではなかったこともあり、学生から積極的な関与を引き出せるのか不安もあったという。「しかし、蓋を開けてみると、学生たちは思いのほか実習に主体的に取り組んでくれましたね。私たちはシステムの使い方、やり方を教えただけで、後は学生たちが自ら仮説を立てて、楽しみながらデータ解析を学んでもらえました」。
柴田教授は、学生たちの積極的関与を引き出せたポイントに、AWSの分かりやすいユーザインターフェースを挙げている。「ほとんどの学生がAWSを使うのは初めてで、本当に使いこなすことができるのか心配していたのですが、AWSの使いやすいユーザインターフェースのおかげで、学生たちは何の違和感もなく実習環境を利用していましたね」。
学生たちが行った実習の中で最も評価が高かったのは、文献アーカイブデータを利用して時系列解析を行ったグループの実習だ。このグループの学生たちは、最新の太陽観測センサーが利用可能になることで、既存の太陽観測センサーのデータが引用される件数にどのような影響を与えるのかということに関心をもった。そのため、海外にある文献アーカイブシステムのデータをAmazon S3上へ一旦保管した後、Amazon EMRにて全論文から太陽観測センサーデータを引用している論文をセンサー名によって抽出・索 引。その上で、Amazon EC2のインスタンス上に実装された解析用プログラムで、太陽観測センサーデータの引用件数の変化を時系列分析した。
「学生たちは、当初は最新の太陽観測センサーデータが発表されると、既存のデータは陳腐化して、引用件数も減少するんじゃないかという仮説をもっていたようなのですが、実際には最新のデータが利用可能になったおかげで、古いデータの引用件数も増加してゆくケースが多かった。もちろん、私も論文を書くときには様々なセンサーデータを引用しますが、引用件数の時系列変化をマクロ的に分析するなどということは考えたこともなかったので、この分析結果はとても興味深かったですね」と、柴田教授はにこやかに語る。
柴田教授は、学生たちの積極的関与を引き出せたポイントに、AWSの分かりやすいユーザインターフェースを挙げている。「ほとんどの学生がAWSを使うのは初めてで、本当に使いこなすことができるのか心配していたのですが、AWSの使いやすいユーザインターフェースのおかげで、学生たちは何の違和感もなく実習環境を利用していましたね」。
学生たちが行った実習の中で最も評価が高かったのは、文献アーカイブデータを利用して時系列解析を行ったグループの実習だ。このグループの学生たちは、最新の太陽観測センサーが利用可能になることで、既存の太陽観測センサーのデータが引用される件数にどのような影響を与えるのかということに関心をもった。そのため、海外にある文献アーカイブシステムのデータをAmazon S3上へ一旦保管した後、Amazon EMRにて全論文から太陽観測センサーデータを引用している論文をセンサー名によって抽出・索 引。その上で、Amazon EC2のインスタンス上に実装された解析用プログラムで、太陽観測センサーデータの引用件数の変化を時系列分析した。
「学生たちは、当初は最新の太陽観測センサーデータが発表されると、既存のデータは陳腐化して、引用件数も減少するんじゃないかという仮説をもっていたようなのですが、実際には最新のデータが利用可能になったおかげで、古いデータの引用件数も増加してゆくケースが多かった。もちろん、私も論文を書くときには様々なセンサーデータを引用しますが、引用件数の時系列変化をマクロ的に分析するなどということは考えたこともなかったので、この分析結果はとても興味深かったですね」と、柴田教授はにこやかに語る。
システム構成図
今後もAWSを活用して文理融合型の人材育成を推進
同ユニットでは、今回のビッグデータ解析実習の成功を足掛かりに、今後も文理融合型の教育活動を積極的に推進してゆく方針だ。「私たちは今回のビッグデータ解析実習で初めて授業にAWSを利用しましたが、ITの進化を取り入れることで、従来とは全く異なるアプローチから教育が行えることを実感できました。例えば最近AWSからリリースされた新サービスである『Amazon Machine Learning』を利用すれば、AWSのクラウド内で機械学習プラットフォームが利用可能になるので、今までよりも早く、快適に解析実習が進められるようになるかもしれません。科学教育へのITの活用は、これからもどんどん進めるべきでしょうね」と、楽しげに語る柴田教授。
今回のプロジェクトを支援したブロードバンドタワーへの期待も高い。「今後もビッグデータ解析技術は、当ユニットの研究・教育の核に位置づけられますが、これらの活動を継続する上では、ビッグデータ活用基盤の豊富な導入実績をもつブロードバンドタワーの知見が不可欠です。これからもデータ解析基盤導入の折には、是非ともブロードバンドタワーに協力をお願いしたいですね」と、柴田教授は語った。
今回のプロジェクトを支援したブロードバンドタワーへの期待も高い。「今後もビッグデータ解析技術は、当ユニットの研究・教育の核に位置づけられますが、これらの活動を継続する上では、ビッグデータ活用基盤の豊富な導入実績をもつブロードバンドタワーの知見が不可欠です。これからもデータ解析基盤導入の折には、是非ともブロードバンドタワーに協力をお願いしたいですね」と、柴田教授は語った。
- 企業名
- 国立大学法人 京都大学 宇宙総合学研究ユニット
http://www.usss.kyoto-u.ac.jp/
- 設立
- 2008年4月
- 所在地
- 京都市左京区北白川追分町 北部総合教育研究棟403号室
- 事業内容
- 分野横断型の総合的な宇宙の研究と教育・人材育成 シンポジウムや講演会、ワークショップなどの社会連携活動