【フルリモ!/最先端技術活用!】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集!

  • ~ 850,000 /月
  • 全国(フルリモートのため)

フルリモート

副業OK
職種
プロジェクトマネージャー プロジェクトリーダー サーバーサイドエンジニア | 【フルリモ!/最先端技術活用!】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集!
業務内容
■募集背景
乗り物(船舶・自動車・航空等想定)の設計書・仕様書を対象に、特化型LLMを構築・高度化する取り組みを加速。
モデル構築面(データ整備〜学習〜評価〜強化学習)で実務に即した技術助言と精度向上の牽引が必要となったため、LLM強化学習(RL)に通じた方を募集しております。

■ご担当業務(お任せしたい工程)
・設計書・仕様書コーパスの前処理・分割・匿名化・正規化に関する方針策定
・SFT → RLHF(PPO/DPO等) を含む学習パイプラインの設計・改善
・評価設計(helpfulness / harmlessness / honesty 等)とメトリクス運用
・エラー分析/失敗例の体系化、データ追加・報酬設計・プロンプト/方針更新提案
・ABテスト/回帰テストの仕組み化、モデル曲線の読み解きと次アクション提示
・週次レビュー、課題管理、ドキュメント整備(日本語中心/英語文献読解あり)

■プロジェクトの進捗状況
3月より開始予定
求めるスキル
■必須スキル
・LLMの強化学習(RL)の実務経験をお持ちの方
・PPO / DPO / RLHF によるモデル最適化の実務
・SFT → RLHF の一連パイプライン構築経験
・データ整備・加工・学習の実務経験(ドメイン文書の前処理・分割・メタ情報設計)
・LLM評価(helpfulness / harmlessness / honesty 等)設計・運用の経験
・論文ベース検証/英日での文献読解
・ロジカルな説明力/ステークホルダーとの高頻度コミュニケーション

■歓迎スキル
・設計文書の構造理解
・セキュリティ/コンプライアンスに配慮したデータガバナンス実務
開発経験
契約形態
業務委託(準委任契約)
契約元
株式会社LASSIC
単価
下限:650,000 円/月 ~ 上限:850,000 円/月
作業開始・終了時間
平日日中帯
勤務地
フルリモート

企業情報

企業名
AI/IoT、生成AI/RAG/AIエージェント、エッジ/フィジカルAI技術の研究・製品開発における受託開発企業

おすすめポイント

エージェントから
🌟特化型LLM × 強化学習(RLHF)の“最先端”に携われる
乗り物(船舶・自動車・航空)の設計書という高難度ドメインを対象に、
SFT → RLHF(PPO/DPO)までのフルパイプライン構築をリードできる希少案件。

🌟モデル精度改善の“技術意思決定レイヤー”を担当できる
データ整備・評価設計・報酬設計・エラー分析など、
モデルの性能を左右するコア部分の裁量が大きい上級ポジション。

🌟3月スタートの新規フェーズで立ち上げから参画できる
プロジェクト開始タイミングに入り、
設計・運用ルールの策定から関われるため、実績・経験の幅が広がる!

ここに掲載されている案件はごく一部です。
Remoguで扱う案件の約80%
非公開案件(Web公開NG)です。

80%が非公開案件
非公開の理由
Remoguが扱う案件の多くは、秘匿性の高いプロジェクト、開発案件です。
案件情報を介して企業の機密情報が競合企業に流出しないよう、情報の扱いに注意が必要と指導されている案件が多くを占めます。
Remoguサイトで検索できる案件は、ご紹介可能な案件のごく一部の事例として参考にしていただき、
あなたのご希望に添った案件は、無料会員登録の後、エージェントから直接ご紹介させてください。

希望する案件が無い場合、「エージェントにオーダー」してください。

エージェントがあなたの営業代行として、希望する条件のポジションを探してきます。

早めのエントリーで
理想的な仕事が見つかる可能性アップ!

時間に余裕を持って、
早期にエージェントへ希望条件を伝えましょう。
あなたに代わって、理想的な仕事を探してきます。