転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
部署・役職名 | Matlantis Site Reliability Engineer |
---|---|
職種 | |
業種 | |
勤務地 | |
仕事内容 |
Matlantis のサービス開発を行う Site Reliability Engineerを募集します。 Matlantis は材料探索を支援するクラウドサービスです。従来の原子シミュレータに深層学習モデルを組み込んだ Neural Network Potential(NNP)に基づいて、原子スケールで材料の挙動を再現して大規模な材料探索を行うことができます。 現在 Matlantis は国内に加えて海外でも展開しており、多くの企業や学術機関から利用いただいています。利用増大に伴い顧客の要望も多様化しており、さらなる成長に向けて解決すべき課題がたくさんある状況です。今回、この Matlantis のサービス開発に携わっていただけるエンジニアを募集します。 【チームについて】 Matlantis の開発は主に Research チーム、コア技術開発チーム、サービス開発の3チームで行っており、今回の募集ではその中のサービス開発チームに参加して Matlantis の開発を行うエンジニアを募集します。 Matlantis サービス開発チームは、コアとなる技術をサービスとして提供するためにフロントエンドからインフラまで幅広く開発・運用を行っています。チームは様々な経歴・経験や得意領域を持ったエンジニアから構成されており、協力しながら素早く継続的に価値を提供していくためにアジャイルに開発しています。 【業務内容】 Site Reliability Engineer は、信頼性の高いサービスを提供するためにインフラ部分を中心に基盤を構築・運用していただくポジションです。 安定した基盤を提供するだけでなく、将来のビジネス展開に備えてスケーラブルにシステム全体を設計する必要があります。そのために、専門知識を理解し、要件を整理して、様々な制約を加味しながら各ステークホルダーと調整を行い、最終的にプロダクトとしてリリースするところまでを担っていただきます。 また、開発環境やプロセスの改善も行っていただきます。深層学習や機械学習を用いたライブラリの開発やフロントエンド、バックエンドなど、希望と状況に応じて幅広く開発に携わることもできます。 技術的に得意ではない部分があってもチームで補完するので問題ありません。スキルや得意領域に応じてアサインは適宜調整されます。計算化学や材料開発等のドメイン知識も不要です。 【業務内容の一例】 ・アプリケーションやミドルウェア、プラットフォームの保守・運用 ・システムの監視とアラート設定、トラブルシュート ・EKS / GKE の運用 ・CI/CD の設計・開発 ・新コンポーネント、ミドルウェアの評価、導入 【技術スタック、利用ツール】 ・Web frontend: React, TypeScript ・Web backend: Python, Flask, SQLAlchemy, Go ・DB: PostgreSQL, Redis ・Infrastructure and middleware: AWS(EKS, ALB, RDS, S3, Glue...), GCP(GKE), Kubernetes, gRPC, OpenAPI, OpenTelemetry, Prometheus, Istio, fluent-bit, K8s Custom Controller, ...etc ・CI/CD: ArgoCD, CodePipeline, GithubActions ・Development environment: Docker, Bazel, Github ・Infrastructure management: Terraform, Helm, Kustomize ・Observability tools: Prometheus, Grafana, loki ・Error monitoring: Sentry We are looking for a Site Reliability Engineer to develop Matlantis services. Matlantis is a cloud service that supports materials discovery. Users perform various material simulations using inference results from PFN's proprietary general-purpose neural network potential called PFP. Matlantis is currently available in Japan as well as abroad and is used by many companies and academic institutions. As the use of Matlantis increases, customer requirements are diversifying, and there are many issues to be resolved for further growth. We are now looking for an engineer to be involved in the development of Matlantis services. 【About the team】 Matlantis development is mainly carried out by three teams: the Research Team, the Core Technology Development Team and the Service Development Team. The Matlantis service development team develops and operates a wide range of services, from front-end to infrastructure, to deliver the core technology as a service. The team consists of engineers with various backgrounds, experiences and areas of expertise, who work together to develop in an agile way to deliver value quickly and continuously. 【Business description】 The Site Reliability Engineer is responsible for the construction and operation of the infrastructure to provide highly reliable services. As well as providing a stable infrastructure, the entire system must be designed to be scalable for future business development. To achieve this, you will be responsible for understanding the expertise, organizing the requirements, coordinating with each stakeholder while taking into account various constraints, and finally releasing the system as a product. You will also be responsible for improving the development environment and processes. You may also be involved in the development of libraries using deep learning and machine learning, front-end and back-end development, or a wide range of other areas, depending on your wishes and situation. If there are areas where you are not technically strong, this is not a problem as the team will complement you. Assignments are adjusted accordingly depending on skills and areas of expertise. Domain knowledge such as computational chemistry or materials development is also not required. 【Examples of work activities】 ・Maintenance and operation of applications, middleware and platforms ・System monitoring and alert configuration, troubleshooting ・EKS / GKE operations ・CI/CD design and development ・Evaluation and introduction of new components and middleware 【Technology stack and tools】 ・Web frontend: React, TypeScript ・Web backend: Python, Flask, SQLAlchemy, Go ・DB: PostgreSQL, Redis ・Infrastructure and middleware: AWS(EKS, ALB, RDS, S3, Glue...), GCP(GKE), Kubernetes, gRPC, OpenAPI, OpenTelemetry, Prometheus, Istio, fluent-bit, K8s Custom Controller, ...etc ・CI/CD: ArgoCD, CodePipeline, GithubActions ・Development environment: Docker, Bazel, Github ・Infrastructure management: Terraform, Helm, Kustomize ・Observability tools: Prometheus, Grafana, loki ・Error monitoring: Sentry |
労働条件 |
雇用形態:正社員 試用期間:3ヶ月(本採用と同条件) 勤務場所:東京都千代田区 勤務体系:土曜日、日曜日、国民の祝日、国民の休日、 その他(慶弔、年末年始) 当社規定による年次有給休暇制度 専門労働型裁量労働制(みなし労働時間:8時間)もしくはフレックス制 待遇:経験、業績、能力、貢献に応じて、当社規定により優遇 年2回見直し 基本給に加え、会社業績および個人のパフォーマンスに応じたボーナス(年2回、4月/10月) 交通費支給 【福利厚生】 社会保険完備(厚生年金保険、健康保険、雇用保険、労災保険) 有給休暇、産前産後休暇、育児休暇、慶弔休暇等 定期健康診断実施 ラップトップPC購入補助 確定拠出年金制度 |
応募資格 |
【必須(MUST)】 <スキル・業務経験>・AWSやGCPなどのクラウドサービスを用いたインフラの設計・構築経験 ・パフォーマンスやスケーラビリティ、可用性を考慮したインフラの設計・構築経験 ・アプリケーション・インフラの監視や障害検知の環境構築経験 ・TerraformやAnsibleなどによるインフラ管理経験 ・CI/CD構築や開発プロセス自動化経験 ・システムの安定稼働やパフォーマンス向上させるのに必要なアプリケーションの改修を行うためのプログラミング能力 ・ネットワーク、セキュリティ、CPU/GPU等計算資源についての知識 <語学力> ・日本語:ビジネスレベル以上 ・英語:日常会話レベル以上 <Skills and work experience> ・Experience in designing and building infrastructure using cloud services such as AWS and GCP ・Experience in designing and building infrastructure with performance, scalability and availability in mind ・Experience in building application and infrastructure monitoring and fault detection environments ・Experience in managing infrastructure using Terraform, Ansible, etc. ・Experience in building CI/CD and development process automation ・Programming skills to make the necessary application modifications to improve system stability and performance ・Knowledge of networking, security, CPU/GPU and other computing resources <Language skills> ・Japanese: business level or above ・English: Daily conversation level or above 【歓迎(WANT)】 ・大規模Webサービスの開発、運用経験・分散コンピューティングに関する知識 ・マイクロサービスでの開発・運用経験 ・Kubernetesおよび周辺コンポーネントの運用経験 ・Kubernetesのプラグインやオペレータの開発経験 ・スクラッチからのAPIまたはWebアプリケーションの設計・開発・運用経験 ・OSSへのコントリビュート経験 ・ビルドツールの運用経験 ・Monorepo環境の設計・運用経験 ・SLI/SLOの設計・運用経験 ・Experience in the development and operation of large-scale web services ・Knowledge of distributed computing ・Experience in developing and operating microservices ・Experience in operating Kubernetes and peripheral components ・Experience in developing Kubernetes plugins and operators ・Experience in designing, developing and operating APIs or web applications from scratch ・Experience in contributing to OSS ・Experience in operating build tools ・Experience in designing and operating Monorepo environments ・Experience in designing and operating SLI/SLO 【求める人物像(Portrait of a person)】 ・自らの意思で行動し、主体的に開発を進められる ・継続的な改善、冗長な作業の自動化ができる ・Self-motivated and able to develop independently ・Able to continuously improve and automate redundant tasks |
アピールポイント | 完全土日休み フレックスタイム |
リモートワーク | 可 「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります |
受動喫煙対策 | その他 「就業場所が屋外である」、「就業場所によって対策内容が異なる」、「対策内容は採用時までに通知する」 などの場合がその他となります。面接時に詳しい内容をご確認ください |
更新日 | 2024/08/11 |
求人番号 | 3770649 |
採用企業情報
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です