あなたは数学が得意ですか?数学が本当に得意ですか? Python のこともご存知で、特定の業界について深い知識をお持ちですか?
このスキルの集合体を持っている可能性があれば、データ サイエンティストに必要な資質を備えている可能性があります。もしそうなら、今は良い時代です。リンクトイン投票したばかりです「統計分析とデータマイニング」は、2014 年に人材を獲得したトップのスキルでした。
Glassdoor によると、データ サイエンティストの平均給与は次のとおりです。118,709ドル対64,537ドルプログラマーにとって。マッキンゼーの調査では、2018 年までに米国は人材不足に直面する可能性があると予測しています。140,000~190,000「深い分析スキルを持つ人材」と、150万人の「ビッグデータ分析を利用して効果的な意思決定を行うノウハウを持つマネージャーやアナリスト」が含まれています。
[slug="warning-college-may-be-a-waste-of-your-time-and-money"] も参照してください。
この分野は現在非常に熱いので、ニューヨーク大学の新しいデータサイエンスセンタープログラムのマネージングディレクターであるロイ・ローランス氏は、ピークに達したと考えていると述べています。 「おそらくバブル状態だ」と彼は言う。 「これほど熱くなったものは、冷めるしかありません。」それでも、ニューヨーク大学は、今後数年間でデータ サイエンス プログラムの学生数を 40 名から 60 名に拡大することを検討しています。現在の学年度はあと 5 か月で終わりますが、学生の 50% ~ 75% はすでに内定を獲得しています。
なぜ爆発が起こったのでしょうか?リンダ・バーチ氏、マネージングディレクターバーチワークスシカゴに拠点を置くエグゼクティブ人材紹介会社は、Google、Amazon、Netflix、Uber などのハイテク企業にはデータ サイエンス グループがあるものの、そのような専門職の活用は現在、ニーマン マーカス、ウォルマート、クロロックスなどの非ハイテク企業に絞り込まれ始めていると指摘しています。そしてギャップ。 「これらはすべて、データサイエンティストを雇用しようとしている企業です」と彼女は言います。
そのような専門家が新たな情報を発掘して、新たな収入源や収益を促進したり、企業のビジネスを合理化したりすることが期待されています。航空宇宙メーカーのプラット・アンド・ホイットニー社は、航空機エンジンのメンテナンスがいつ必要になるかを 97% の精度で予測できるようになり、おそらく業務の効率化に役立つと IBM のビッグデータ担当副社長のアンジュル・バンブリ氏は述べています。
IBMは今月、フリーミアムのクラウドベースのWatson Analyticsプログラムをリリースしたばかりだが、ほとんどの場合、データサイエンティストは非構造化データを分析するために自社製のソフトウェアプログラムを作成する必要があり、これがプログラミングスキルが必要とされる理由の1つである。
学校教育
ローランス氏は、データサイエンティストが持つ必要のあるスキルは基本的に 3 つあると述べています。それは、数学/統計、コンピュータ リテラシー、特定のビジネス ドメイン (たとえば、自動車など) の知識です。ニューヨーク大学のプログラムでは、各専門分野が他の分野に基づいて構築されるように、これらのスキルを教えています。 。卒業すると、データ処理の何でも屋になります。 「コースワークでデータ サイエンス プロジェクトに取り組む場合、すべての作業を行う必要があります」と彼は言います。
ただし、データサイエンティストになるために誰もが大学のコースを受講する必要があるわけではありません。たとえば、Metis という会社は、12 週間のデータ サイエンス ブート キャンプ9月に。ニューヨークでのこのプログラムの費用は 14,000 ドルで、入場競争は非常に競争的です。 Metis の共同創設者であるジェイソン・モス氏は、約半数の学生が修士号または博士号を取得して入学してくると言います。
12月初旬に最初のブートキャンプが終了してからわずか数週間後、クラスの15人の生徒のうち6人が就職の内定をもらったとモス氏は語った。
「これが大学の代わりになるとは思いません」とモスは自分のプログラムについて語る。 「大学は就職への最短距離以上のものだと思います。また、データサイエンティストとして成功するために大学に行く必要があるとも思いません」と彼は言います。 「生来好奇心旺盛、根性があり、物事を理解したいという性格タイプがあり、それがうまくいきます。」
独立系のデータサイエンティスト兼コンサルタントであるアンモル・ラジプロヒット氏は、この分野の仕事では学習が早いことが最も重要な資質であると述べています。 「一般的なプログラミング スキルは、特定のプログラミング言語の専門家であることよりもはるかに重要です」と彼は言います。 「テクノロジーが急速に進歩する時代に生きていると、言語が急速に廃れ、新しい言語が急速に普及するのが目に見えています。したがって、学習の早い人は、専門家よりもはるかに先を行くことができます。」
ローランス氏は、ブートキャンプやオンラインベースのコースは、あるスキルには強いが他のスキルには弱い候補者にとって役立つと信じていると語った。ニューヨーク大学のプログラムの長所の 1 つは、スキルを順番に教え、スキルを積み上げていくことです。 「私たちは、あなたが必要とするすべてのものを、理にかなった順序で提供します」と彼は言います。
ジョン・グリーンバーグ クレジット: ジョン・グリーンバーグ
データサイエンティストの仕事
「平均的な日は、私は会社のビジネス、つまりユーザーが何をしているのかを伝える一連のダッシュボードを管理しています」と、データ サイエンティストのジョン グリーンバーグ氏は言います。プレイスタジオ, ゲーム会社。グリーンバーグは現在マネージャーなので、以前よりもプログラミングの頻度は減りましたが、それでもそれなりの仕事はしています。通常、彼は Apache Hadoop ストレージからデータを引き出し、分析プラットフォームである Revolution R を通じてそれを実行し、ある種の視覚化を考案します。 「それは、人口の一部が新しい機能とどのように対話しているかによるものかもしれません」と彼は説明します。
グリーンバーグ氏は6年前に統計学の修士号を取得した。彼は政府機関への就職を期待していましたが、民間部門でもデータサイエンティストの需要が非常に高いことに驚きました。 「当時は間違いなく、それほど暑いフィールドではありませんでした」と彼は言います。現在、ヘッドハンターからの電話かメールは 1 日に 1 件程度あると彼は言います。 「それは私ではありません」と彼は言います。 「彼らはおそらく(この専門知識で)他の人たちに迷惑をかけているでしょう。」
グリーンバーグにとって、雇用に適していることはプラスですが、彼は仕事自体を愛しています。 「それは、分析的な心を持たなければならないということから始まると思います。好奇心を持たなければなりません」と彼は言います。 「柔軟かつ創造的になって、問題を解決する別の方法を考えなければなりません。」グリーンバーグ氏によると、この仕事の唯一の欠点は、データの「クリーニング」、つまり無関係な結果を削除するためにデータを整理するのに時間がかかることだという。 「その部分はそれほど面白くないので、それに多くの時間を費やします」と彼は言います。
Rajpurohit 氏は、データのクリーニングだけでなく、研究にも多くのエネルギーを費やしていると言います。 「私の時間のかなりの部分は研究に費やされています。まったく新しい問題に遭遇することがよくあるため、その特定の分野の研究に関する最新の文献を調べたり、そのトピックの専門家にアドバイスを求めたりする必要があるからです」と彼は言います。
「その名前にもかかわらず、データサイエンスには芸術と科学の両方をうまく組み合わせる必要があります。科学の部分は明らかです - 数学、プログラミングなどです。芸術の部分も同様に重要です - 創造性、深い文脈の理解など。どちらの部分も重要です力を合わせれば、優れた問題解決者になれるのです。」
そうは言っても、ラジプロヒット氏は、「データ サイエンスで働くことは、最近認識されているほどセクシーでも魅力的でもありません」と認めています。この分野は間違いなく組織全体で重要性を増しています (そして高給のオファーも見られます) が、データ サイエンティストがほぼ毎日取り組む必要がある、それほど魅力的ではないタスクがたくさんあります。」
これがあなたにとってのキャリアですか?
1 日の多くの時間をプログラミングと関連情報のダッシュボードの分析に費やすという考えに魅力を感じるなら、あなたはコンピューター サイエンティストの素質を持っているかもしれません。ただし、単に給与だけをモチベーションにしている場合は、さらに厳しい状況になるかもしれません。考慮してください: この分野に属する人々は、自分を楽しむためだけに余暇をプログラムの作成やデータの分析に費やすことがよくあります。
Burtch Works のデータ サイエンス採用担当者である Adam Flugel 氏は、この秋にエレクトロニック アーツに配置した最近の候補者である博士号取得者のことを思い出します。 「特に目立ったのは、彼が自由時間に楽しみのために行っていた仕事でした」とフリューゲル氏は言います。 「彼はオンライン マルチプレイヤー ゲーム World of Tanks に参加し、基本的にプレイヤーのチームである「クラン」を率いていました。彼はゲーム サーバーからデータを収集するユーティリティを作成し、そのデータに対して分析を実行してクランのパフォーマンスを評価しました。この情報を使用して、戦略を調整する方法、チームを改善するためにどのようなタイプの選手を採用する必要があるかなどを判断しました。」
データそのものが好きでない場合、そのような候補者と競争するのは難しいでしょう。しかしバーチ氏は、たとえ自分のキャリアのためであっても、誰もがデータを愛することを学ぶべきだと言う。 「10 年も経てば、データマニアでなければ、経営幹部の一員であることを忘れてしまうかもしれません」とバーチ氏は言います。
しかし、スティーブ・ジョブズやビル・ゲイツ、その他の先見の明のある人々は全体像を見て、データサイエンスの細部に囚われなかったのはどうでしょうか? 「あれは30年前のことです」とバーチ氏は言う。 「私が話しているのは今後10年間のことです。」