インターネットは巨大で、6 億 3,400 万以上の Web サイトが 30 兆ページ以上をホストしています。そのため、私たちは皆、良いものを見つけ出すために何らかの助けを必要としています。私たちの多くはソーシャル メディア サイトにアクセスし、そこで縮小され、他のユーザーによって共有されているリンクに遭遇します。少しずつ。実際、ソーシャル Web 上のリンクの 30% は bitly リンクです。この規模により、ニューヨークに本拠を置くスタートアップ企業は、ウェブ上で何がクリックされ共有されているかをリアルタイムで把握できる確かなデータセットを得ることができます。ヒラリー・メイソンの主任科学者としての仕事は、そのデータを厳選して興味深い情報を抽出することです (特に、犬と猫が本当にウェブを支配しているかどうかなどの重要な事柄)。
メイソンは最近、ビジネス界で最もクリエイティブな100人、そしてこの認識はデータサイエンスの新たなフロンティアを告げるものです。なぜなら、科学と工学は一般に「創造的な」分野とは考えられていませんが、実際には「創造的な」分野だからです。メイソンは本質的にストーリーテラーであり、彼女のストーリーは、彼女が発見したデータと、それが人間の本性や社会的行動について明らかにするものによって動かされます。
Mashable とのインタビューで、メイソン氏はビッグデータ、好奇心、そして大学がコンピューター サイエンスのカリキュラムを再考する必要がある理由について語ります。データ サイエンスに関する彼女の洞察を読んで、さらにデータの知識が欲しくなったら、Mason のお気に入りのデータ サイエンス ブログをいくつかチェックしてください。このちょっとしたバンドルの中で、そして彼女を読んでくださいデータサイエンスを始めるためのヒント。
bitly のチーフサイエンティスト、ヒラリー・メイソンとの Q&A
なぜデータサイエンスに興味を持ったのですか?
私はコンピューター科学者として育ち、常にアルゴリズムに魅了されてきました。私がこのような仕事を始めたときには「データ サイエンス」というラベルは存在していませんでしたが、これはアルゴリズムの研究の自然な延長です。問題を解決するためのメソッドを記述することと、問題を解決するためのメソッドを記述することは別のことです。データの問題を解決します。人間の社会的行動を人間の社会的行動のスケールで調査できるデータセットを備えた bitly で働くことができて、私はとても幸運です。
bitly のデータを調べて見つけた最も興味深い発見は何ですか?
いろいろ!さまざまなソーシャルネットワークがあることをご存知ですか?違う使い方をするさまざまな国で?それスポーツに関する記事は半減期が最も短い(つまり、他のストーリーよりもはるかに早く注意が薄れてしまうということです)?それ営業時間内にTwitterに投稿する必要があります?あるいは実際に存在するということインターネット上で共有される写真は猫より犬の方が多い猫はインターネット上で共有されるものの愚かさの象徴になっているにもかかわらず?
今日のデータの最も興味深い用途は何ですか?
金融や広告ではデータの利用法がたくさんありますが、私はデータを利用して他の方法では決して得られなかった能力を構築することにもっと興奮しています。データは私たちにスーパーパワーを与えてくれます。
私は愛する予測.io、政府の気象データ、GPS 位置情報を取得し、いくつかの処理を行います。機械学習現在地だけの正確なマイクロ予報を提供します。私もますます感動してますマイク・フラワーズの作品ニューヨーク市の最高分析責任者と彼のチームは、より最適な救急車の位置を見つけることで、ニューヨーク市の救急車の応答時間を 1 分短縮するなどの成果を達成しました。
ヒラリー・メイソンが自身が作成した電子メールハックをいくつか共有
HackNY、その起源、そして関わっている学生やスタートアップについて教えてください。
ハックNYは、才能ある学生をニューヨークのスタートアップ企業での機会と結びつけ、学生が優れた技術専門家になるようサポートすることで、ニューヨークのクリエイティブな技術コミュニティへの学生の架け橋を提供し始めました。それは素晴らしい仕事をしました!
あなたはいくつかのスタートアップ企業のアドバイザーを務めています。ノッズエスそしてデータの種類-- スタートアップに惹かれるのは何ですか?
私は、私が興味を持っている分野や製品において、解決不可能な困難な問題に取り組んでいる創造的で賢い人を探しています。基本的に、私は世の中に存在してほしいものを見つけて、その存在を助けるためにできることをしようとしています。
優れた科学者に求められる性格的特徴は何ですか?
好奇心、創意工夫、粘り強さ。科学は失敗を繰り返しながらも学び続けるものです。優れた科学者は、ある分野の現状を理解し、成功が実際に役立つ新しい知識につながる興味深い質問を選び、研究を通じてその分野をさらに推し進めることができます。
A7: データ サイエンスの真の期待は、膨大な量のデータを取得し、それを人間の心に簡単に理解できるようにすることです。#クラウドチャット
— ヒラリー・メイソン (@hmason)2013 年 5 月 9 日
データサイエンスの将来はどうなるでしょうか?
データ サイエンスには明るい未来が待っています。データはますます増え、そのデータに意味と価値を見出すことができる人材の必要性はますます高まるでしょう。また、データとアルゴリズムを中心にインフラストラクチャを構築するデータ エンジニアや、データを視覚化できるデータ アーティストのニーズも高まり始めています。
最近のイベントでWIM、コンピューター サイエンスは大学で正しく教えられていないという感想について話しましたが、これはどういう意味ですか?
一般的な CS の入門カリキュラムは難しく構成されているため、これまでその内容を見たことのない人は不利になり、現実の世界、さらにはソフトウェアの現実の世界とはまったく関連性のないプロジェクトに取り組む人もいます。エンジニアリング。一般的な割り当ては、階乗を解いてから、再帰的に再度解くことです。これらの問題に対して複数のテクニックを学ぶことがなぜ重要なのかを理解せずに同じ出力を見て、学生がイライラしていることがわかりました。
学生がテクノロジーを使って物を作ることに真剣に取り組む入門カリキュラムをぜひ見てみたいと思っています。コンピューター サイエンスは力を与えてくれます。コンピューター サイエンスを専攻する予定がなくても、テクノロジーを使って物を作ることは、最終的に何をする場合でも身につけることができるスキルです。