データサイエンティストとしての自分を評価する
データサイエンティストになるにはどのようなスキルが必要ですか?
この質問に答えるための興味深いデータ駆動型のアプローチを、書籍『Doing Data Science: Straight Talk from the Frontline』で読みました。
この投稿では、データ サイエンティストとしての自分の強みと、優れたデータ サイエンス チームにどこに当てはまるかを評価するために使用できる自己評価のアプローチを要約します。
必要に応じて、応用機械学習の実践者をデータ サイエンティストの同義語として使用することもできます。
データサイエンスのユニコーン
『Doing Data Science』の著者らは、データ サイエンティストの仕事を検討して、雇用主がユニコーンを求めていることに気付きました。
求人広告では、コンピュータ サイエンス、統計、コミュニケーション、データ視覚化、および専門分野の専門知識を持たない従業員を求めています。
「データサイエンティスト」という用語の定義が曖昧であり、雇用主は自分たちが何を必要としているのか、さらにはどのような問題を解決する必要があるのかさえわかっていないことを考えると、これは驚くべきことではありません。
スキルヒストグラム
巧妙なことに、著者は求人広告からデータ サイエンティストに一般的に必要なスキルのリストを作成しています。
彼らはこのリストを使用し、各スキルに対する相対的なスケール (0 ~ 100) で自分自身をランク付けすることを提案しています。
最後に、結果を棒グラフまたはヒストグラムとして表示することを提案しています。
1 人ですべてのスキルを習得できるわけではありませんが、適切に設計されたデータ サイエンス チームならすべてのスキルを習得できます。
この自己評価におけるスキルは次のとおりです。
- コンピュータサイエンス
- 数学
- 統計
- 機械学習
- ドメインの専門知識
- コミュニケーションとプレゼンテーションのスキル
- データの視覚化
この本の 11 ページにあるレイチェルの完成した評価の例は次のとおりです。
これは、自分の強みに焦点を当て、チームメンバーがカバーできるように支援できる自分の弱みを認識するのに役立つツールだと思います。
スキルヒストグラムのアンサンブル
データ サイエンスで優れた結果を得るにはチームが必要です。
個人には専門分野があるかもしれませんが、他の分野は一般的に苦手である可能性があります。多様な強みを持つ個人がチームに集められてこそ、優れたデータ サイエンスを実現できるのです。
著者はこれを次のように図で示しています(本の12ページから抜粋)
自分自身を評価する
上記7つの中であなたの強みは何ですか?
これらの各スキルについて、自分自身に 1 ~ 100 の主観的なスコアを付けることができますか?
私の自己評価の試みについては、以下を参照してください。
大変ですよ。私の強みはおそらくコンピューターサイエンス、機械学習、コミュニケーションにあると思います。上のグラフは、私の視覚化スキルがそれほど優れていないことを示しています。
スキルを伸ばすのはとても簡単だと思います。どれだけ優れているのか、またあるスキルを別のスキルとどのように比較しますか?コンピューター サイエンスの離散数学が得意であっても、微積分がくだらないものであれば、数学の得点にはつながりません。統計って数学ですよね?すぐ。それでも、どこかから始めなければなりません。
ここで学ぶ重要なことは、自分の強みを特定し、それをさらに伸ばすことです。すべてのスキルを習得することはできません。あなたの最強のスキルを発揮してください。
以下に結果を投稿してください。これは、小さなプロジェクトや Kaggle コンテストで人々をグループ化するための魅力的な方法だと思います。
上記に欠けているスキルはありますか?