転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
部署・役職名 | ※副業参画可 AIエンジニア(10月新規上場|パーソナルAIスタートアップ) |
---|---|
職種 | |
業種 | |
勤務地 | |
仕事内容 |
プロジェクト概要 経済産業省およびNEDO(新エネルギー・産業技術総合開発機構)による国内生成AIの開発力強化プロジェクト「GENIAC」に採択され、総費用約7.9億円におよぶGPU計算リソースとデータセット構築の助成を受けています。このプロジェクトでは、日本の労働力を補完するための大規模言語モデル(LLM)の構築と、それを支援するInstruction Pre-training(指示に基づくトレーニング)のためのデータ構築を進めます。 公式サイト: ALT News Release 業務内容 Instruction Pre-training向けの指示合成器のデータ構築 合成データの作成 Instruction Pre-training用の学習データを合成し、LLMがさまざまな指示に対応できるようにするデータセットを構築。 LLMの調査・選定 合成データを生成するために最適な大規模言語モデルの調査・評価を行い、プロジェクトの要件に合うモデルを選定。 データ品質管理 合成データの品質管理 作成した合成データの品質を確認し、モデルが指示に対して正確に応答できるか評価。 アノテーションデータの品質チェック アノテーション会社から納品されたデータの品質管理と分析を行い、正確性と信頼性の高いデータセットを構築。 RAG(Retrieval-Augmented Generation)システム構築 WEBベースのRAGシステム構築 WEB上の情報をモデルに取り入れ、指示に応じた適切な応答が生成できるよう、情報検索(Retrieval)を組み込んだ生成システムを開発。 データ翻訳とコンテキスト付き英語データセットの調査 データセット調査・翻訳 英語のコンテキスト付きデータセットを調査し、必要に応じて日本語との翻訳対応を行い、Instruction Pre-trainingに適したデータを整備。 |
応募資格 |
【必須(MUST)】 ・国際会議での研究発表経験特にLLM(大規模言語モデル)や自然言語処理(NLP)、機械学習、音声処理分野におけるトップカンファレンス(NAACL、EMNLP、ACL、IJCNLP、COLING、EACL、INLG、TACL、NeurIPS、ICLR、ICML、IJICAI、Interspeech、ICASSP)での研究発表経験があること。 ・論文の再現実装の経験、既存モデルをコードレベルで変更し、モデルのアーキテクチャを改造した経験 |
アピールポイント | 創立5年以内 ベンチャー企業 年間休日120日以上 |
リモートワーク | 可 「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります |
受動喫煙対策 | 屋内禁煙 |
更新日 | 2024/12/23 |
求人番号 | 4026859 |
採用企業情報
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です