求人情報詳細
NEW GMOインターネットグループ株式会社 機械学習エンジニア
正社員
1000万円
勤務地 | 東京都渋谷区桜丘町26番1号 セルリアンタワー | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
想定年収 | 6,000,000 円 ~ 10,000,000円 | ||||||||||||
仕事内容 | グループ研究開発本部は、GMOインターネットグループの事業領域で力を入れているスタートアップやグループ横断のプロジェクトにおいて、技術支援・開発・解析などを行い、ビジネスの成功を支援する部署です。 その中にAI研究開発室があり、データ解析やAIに関する支援を行っています。また、最新のテクノロジーを常に研究開発し、いち早くビジネスに投入し結果に繋げます。 以下のいずれかにまず参加して頂きます。その後さらに専門性を高めて頂くか、もしくは他のプロジェクトに参加して、実績に応じて希望のキャリアを積んで頂きます。 ●フィンテック(Fintech)のプロジェクト GMOインターネットグループが展開する金融サービスの本質を理解し、数理モデルや機械学習などのデータサイエンス技術を駆使しながら、予測が難しい金融データをうまく扱って収益を改善させます ●アドテク(Adtech)のプロジェクト インターネット広告の主な仕組みの一つであるRTB(リアルタイム入札)において、広告出稿する側の費用対効果を最適化するDSP(Demand-Side Platform)の機械学習モデルの設計開発、効果測定などをメインに行います ●アプリのプロジェクト フリーWiFi接続を容易にするアプリの新機能や施策の効果測定を因果推論の技術を駆使して行い、データドリブンに経営判断するための仕組みを整えて、サービスのKPIを改善させます ●その他のプロジェクト 暗号資産取引、不正検知などに関して、データ解析や機械学習の技術を応用して支援します 【研究開発業務】 ・プロジェクト業務を行いながら、一定の時間、全員で最先端の機械学習手法や新たな機械学習の応用を研究します ・さらに四半期ごとに選任されたメンバーは重点的に研究開発を行います 【ポジションの魅力】 GMOインターネットグループの多岐に渡るサービスについて、データ解析およびAI技術によって様々な課題を解決するプロジェクトをゼロから立ち上げる機会があります 世界 No.1 規模の金融データや、数百テラバイト規模のアドテクデータなど様々な領域のデータを直接扱うことができ、ビッグデータを解析する技術(BigQuery・PySparkなど)も習得できます 時系列データ、ユーザー行動データ、記事といった様々な種類のデータを解析することができます 担当するプロジェクトのビジネス領域や、最先端の機械学習・深層学習・統計手法などを常に学べます 重要な3つのスキル(ビジネス課題解決・データサイエンス・エンジニアリング)を身につけ、一つ以上強みを大きく伸ばせます 別のプロジェクトを担当する部署のデータサイエンティストと勉強会などで交流する機会も多く、データサイエンススキルを高められます グループ研究開発本部配下のエンジニア精鋭部隊である次世代システム研究室のメンバーと一緒に業務することが多く、エンジニアリングスキルが伸ばせます グループCTO直轄の部署であり、技術の選定は現場に一任されているため、最先端の技術を自ら検証・導入することができます 全て自社サービスのため、事業部と一緒に自ら課題を設定し解決方法を考え、データサイエンスに基づいた改善サイクルを行うことができます 本人の実績と意欲に応じて、チームの重点テーマについて自由に研究開発する業務に挑戦することができます アカデミックな分野で活躍してきた博士やエンジニア出身者などでチームが構成され、多様性のあるチームです 【利用技術】 ●解析手法 機械学習: Transformer系(大規模言語モデル他)、グラフニューラルネットワーク(GNN)、多層パーセプトロン(MLP)、アンサンブル学習/勾配ブースティング(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost, LightGBM)、PCA、FP-Growth、Word2Vec、Doc2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル) 統計分析: t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析、因果推論(差分の差分法など) ●開発技術/環境 プログラミング/フレームワーク Python、PyData(numpy、scipy、pandasなど)、Streamlit PyTorch、TensorFlow、LangChain、Spark(PySpark) クラウド/オンプレ(ミドルウェア) Google Cloud(GCS、BigQuery、VertexAI、Dataflowなど) AWS(S3、Athena、EMR/Serverless、StepFunction、SageMaker、Bedrockなど) MySQL、MariaDB、Percona Server、PostgreSQL、Galera Cluster、Oracle、Hive、Hadoop/HDFS ConoHa(GPUサーバー) 大規模言語モデル(LLM)関連 OpenAI API、Llama3、LangChain、HuggingFace ●開発ツール Atlassian(Jira、Confluence)、Trello VS Code、PyCharm、Jupyter GitHub(Copilot) Tableau、Looker Studio、metabase ChatGPT、Gemini、Claude ●開発手法 アジャイル開発(scrumベース) |
||||||||||||
経験・資格 |
※求人情報の応募要件全てに該当しなくても、企業様に対して内々に打診したり相談することが可能な場合もございます。一つでも当てはまる方は前向きにご検討下さい。
【必須スキル/経験】以下の条件をすべて満たしている方 ・実際にプロダクトもしくは研究で機械学習/深層学習を活用して実績を出した経験がある ・機械学習モデルを実業務で実装し本番運用した経験がある ・システム開発におけるテストをきちんと行える ・Pythonが書けて、オブジェクト指向がわかる ・一通りの機械学習・深層学習の知識がある 【歓迎スキル/経験】 ・博士号を取得している ・「確率論・統計学」の基礎が身についている 【活躍できる人物像】 ・手法ありきではなく、ビジネス課題解決のためにあらゆるアプローチを考えて最適なやり方を見出すことが好きな方 ・どんなことにも興味をもち、情熱をもって新しい技術、新しい業務にチャレンジできる方 ・一人では到底できない大きな成果をチームで目指せる方 ・データや結果を鵜呑みにしないで、常にクリティカルシンキングを行える方 ※更なる詳細事項は、カウンセリング(面談)時にお伝えします。 |
||||||||||||
企業データ |
|
||||||||||||
Recruiting No. | 01005000000207 | ||||||||||||
ひとことコメント | グループ全体で、インターネットインフラ、インターネット広告・メディア、インターネット証券、モバイルエンターテイメントをメイン事業等を手掛ける、国内屈指のインターネット企業。 事業内容は多岐に亘るが、どの事業でも「シェアNo.1」を取ることにこだわっている。 グループ会社は100社を超え、その中には上場会社も含まれる。さらにグローバル展開も積極的で、20ヶ国以上の国に拠点を持つ。 2023年10月、同社は東京大学医科学研究所と、生成AIを活用して老化細胞の選択的除去を人間に応用することを目指した共同研究に取り組むことが発表された。 同社は、老化細胞に関する大量のデータ解析の効率化を図るためのAI活用や、データサイエンティストやエンジニアを派遣するほか、画像処理半導体を搭載したサーバーを提供する。共同研究は5年間を予定。 ※老化細胞:分裂をしなくなった細胞のことで、老化や加齢性疾患につながるとされている。 働きやすい環境づくりに積極的に取り組んでおり、フード・ドリンクが全て無料のカフェテラス(ランチはビュッフェ)、マッサージスペース、昼寝スペース、社内託児所等が整備されている。2023年10月、同社は東京大学医科学研究所と、生成AIを活用して老化細胞の選択的除去を人間に応用することを目指した共同研究に取り組むことが発表された。 同社は、老化細胞に関する大量のデータ解析の効率化を図るためのAI活用や、データサイエンティストやエンジニアを派遣するほか、画像処理半導体を搭載したサーバーを提供する。共同研究は5年間を予定。 ※老化細胞:分裂をしなくなった細胞のことで、老化や加齢性疾患につながるとされている。 働きやすい環境づくりに積極的に取り組んでおり、フード・ドリンクが全て無料のカフェテラス(ランチはビュッフェ)、マッサージスペース、昼寝スペース、社内託児所等が整備されている。 |
関連する業種から探す
エリートネットワークのおすすめの『転職体験記』