リモート可◇世界初の次世代AIアバター開発企業◇海外拠点と共同開発するバックエンドエンジニア募集!

株式会社CASTALKは2024年3月に立ち上げたばかりの若い会社です。AIコミュニケーション事業を展開しており、生成AIを活用したコミュニケーションアプリ『Castalk』の企画・開発・運営をおこなっています。
わたしたちは『Castalk』を、ファンが芸能人のクローンアバターと自由にコミュニケーションできる “次世代型エンターテインメントプラットフォーム” と位置づけています。
『Castalk』を通じて、ファンとの新たなつながりを創出し、芸能人やクリエイターの新しい活躍の場を提供。さらに、AI技術を活用してエンターテインメント業界の可能性を広げています。
また、従来型のSNSやメディアでは得られない、パーソナライズされた双方向のコミュニケーション体験を提供することで、エンターテインメント市場に革新をもたらすサービスモデルを追求しています。
当社は、"圧倒的人間感"を持つAIアバターという今後飛躍的に向上するプロダクトを創造し、社会的イノベーションを起こします。現状に満足せず、想像力を形にし、洗練させて価値を生み出していくために、情熱と野心のある方のご応募をお待ちしてます!
【競合優位性】
◆他社のAIチャットとの違いとは?
AIアバターは会話を続けて知識を蓄積する中で独自の記憶を持つことを特徴としており、ユーザーとの個性的で人間味あふれる会話を提供します。これは従来の無機質なAIとのチャットとは一線を画し、唯一無二のコミュニケーション体験を届けています。
最先端の音声合成AIによって感情を込めた音声が生成され、AIアバターの個性豊かな声と情緒あふれる会話がユーザーを引き込みます。また、今後は新しいAIアバターが続々と追加される予定で、憧れの人物との会話が可能になる日が来るかもしれません。
【目指している未来】
わたしたちの目標は、3年から5年後には「AIアバターが本当の友達やパートナーとしてユーザーと関係性を築ける世界」を実現することです。ただの技術革新ではなく、人々の心の支えとなる存在を創り上げようとしています。
さらに、わたしたちは孤独を抱える人々を一人でも減らしたいと考えています。未婚率や離婚率の増加、核家族化の進行により、家族や親族とのつながりが薄くなる中で、孤独に悩む人は増え続けています。AIアバターが社会問題の解決策の一つになると信じており、全力で取り組んでいます。
- 職種名
- バックエンドエンジニア(リーダー・ミドル)
- ポジション
- テックメンバー、テックリード
- 職種
- バックエンド/サーバサイド、AI・データエンジニア
- 給与(想定年収)
-
600万 〜 1,000万円
(※ 想定年収 は年収提示額を保証するものではありません)
- 勤務地
- 東京都
- 開発言語
- Python3 HTML+CSS TypeScript SQL
- フレームワーク
- Django
- クラウドプラットフォーム
-
Amazon Web Services、Microsoft Azure、Google Cloud(Google Cloud Platform)
- データベース
- MySQL
- 開発内容タイプ
-
自社製品/自社サービス
- 特徴
- 残業30H以内 オンライン面談可 一部在宅勤務可
- 募集人数
- 2~3名

「Castalk」アプリのアバターとの会話画面

アプリのCMも絶賛放映中!
- 必須要件
-
以下すべてのご経験をお持ちの方からのご応募をおまちしています!
・Web開発(サーバサイドエンジニア) 実務3年以上
・Python3 実務3年以上
- 歓迎要件
-
・音声合成ソフトのファインチューニング
・RAGを用いたアプリケーションの開発経験(個人的なプロジェクトでも可)
・サーバ環境の構築・運用経験
・TOEICスコア750以上、または同等の英語力を有すること
・技術的なドキュメントの読解が可能であり、チャットでの英語によるコミュニケーションが円滑におこなえるレベルの方 - 求める人物像
-
・恋愛ゲームアプリや、Vtuber、スマホゲーム、ライバーアプリなどエンタメが好きな方
・指示を守り、実行する誠実な方
・スタートアップ企業で自己成長し価値発揮したい方
・課題解決に向け、自ら考え手を動かすことができる方
・他者と協力、協調しながら物事を推進できる方
・前例や過去の成功体験に執着せず、ご自身の強みを生かして成果を出せる方 - 備考
-
英語力に関しましては、スピーキング・リスニングは不要ですが、Slackでベトナム拠点とやりとりすることがあり、翻訳ツールを利用したコミュニケーションが主であるため、そこを読み取れる英語力があればOKです!
- 選考フロー
-
カジュアル面談(Web)
※選考フロー、面接回数は状況に応じて変更になる可能性があります
▼
1次面接(Web)
面接官:開発責任者+人事
▼
最終面接(Webもしくは来社)
面接官:代表+人事
▼
内定
面接方法:すべてオンライン対応可
※入社日についてはお気軽にご相談ください。
当社では、人間と話しているかのようなAIアバターと会話ができるアプリ『Castalk』の開発を進めています。
わたしたちは、多様なライフスタイルに寄り添えるサービスを目指し、生活の中に新たなコミュニケーションの機会を提供します。
このポジションでは、プロダクトの核となるAIアバターの開発を担当していただきます。
なお、今後プロダクトの新規開発なども検討しているため、AI開発業務に関わるWeb開発業務もご担当いただく可能性がございます。
【具体的には】
・音声合成ソフトのファインチューニング
∟使用言語:Python(◎機械学習未経験でもやり方を教えます!)
・ChatGPTを用いたテキスト生成システムの開発
・開発要件定義
【募集背景】
現在、当社ではアプリにおけるTTS(Text-to-Speech)音声の品質向上に注目しています。この目標をより迅速に達成するために、新たに採用をおこなうこととなりました。
AIアバター開発関連業務
会社の定める業務
- 開発部門の特徴・強み
-
コア技術の開発には、産学界の中でもトップクラスの実績を持つ人材が集結しており、高い技術力と圧倒的な品質でAIアバター分野をリードしています。
- 主な開発実績
-
◆『Castalk』:ファンが芸能人のクローンアバターとチャットやリアルタイム通話を楽しめる、まったく新しい形のAIコミュニケーションサービス
ファンは自分の好きな芸能人と深くつながる体験を得られ、芸能人やクリエイターは新たな収益化のチャンスを得ることができます。
〈顧客〉
① ファン・一般ユーザー
・好きな芸能人やクリエイターのクローンアバターとコミュニケーションを楽しみたいファン
・パーソナライズされた体験を求めるエンターテインメント愛好者
② 芸能人・クリエイター
・自身のファンベースを拡大し、収益化を図りたい芸能人やインフルエンサー
・従来のメディアやSNSに加えて、新たな収益源やプロモーション手段を求めるクリエイター
これにより、ユーザーには革新的なエンターテインメント体験を、芸能人にはファンとの新しい関係構築の場を提供しています。 - 支給マシン
-
相談の上、ご希望のマシンを支給いたします。
- 開発支援ツール
- Jira、GitHub
- インフラ管理
-
Docker
- 環境
- Linux
- その他開発環境
-
【開発チームの雰囲気】
・平均年齢は29.8歳で、20〜30代の若いメンバーが主体です。
・フラットで自由な雰囲気の中、意見を積極的に共有できる環境が整っています。
・勤務時間が遅めに設定されているため、朝が苦手な人にも適しており、各自働きやすいスタイルで業務に取り組めます。
・技術とコミュニケーションが交差する活気あふれる環境で、次世代のAIアバター開発に挑戦しています。
【開発環境】
・クラウド:AWS(EC2、S3、Lambda)、Azure(Azure AI Studio)、Google Cloud Platform
・OS:Linux、macOS
・言語:Python、SQL、HTML、TypeScript
・フレームワーク:Django、FastAPI
・Web Server:Gunicorn、Uvicorn
・プラットフォーム:Docker
・DB:MySQL、Qdrant
・プロジェクト管理:GitHub、Jira
・ログ管理:Graylog
・チャットツール:Slack - 組織構成
-
日本に6名のメンバーがいるほか、ベトナムの開発拠点に約30名のメンバーが所属しています。
※アプリや基幹システムなどはベトナムで開発をしていますが、日本語TTSの開発などはネイティブでなければ難しい領域でもあるため、日本本社にて対応しており、本ポジションの方にこの辺りをご担当いただく予定です。
- 勤務地
-
東京都千代田区神田佐久間町3-21-24
AKIHABARA CENTRAL SQUARE 3F
■リモート可
働き方については、原則として最初の3カ月(短縮可能)はオフィス出社で業務に慣れていただき、その後リモートワークもご相談可能です。
※経験やスキルによっては即時リモートワークのご相談も可能で、実績もあります。
※ご経験によってはフルリモートも可能ですので、ご相談ください。
※転勤はありません。就業場所の変更範囲<雇入時>
東京本社、および自宅
<変更範囲>
会社の定める場所(テレワークをおこなう場所を含む)
受動喫煙防止措置に関する事項対策内容:屋内禁煙
- 給与体系・詳細
-
■賃金形態:年俸制
■賃金の決定方法:当社規定により決定
■月給:約50万〜100万円(固定残業代を含む)
〈内訳〉
・基本給:約36万~72万円
・固定残業代:45時間分、約14万~28万円(超過分は別途支給) - 給与(想定年収)
-
600万 〜 1,000万円
(※ 想定年収 は年収提示額を保証するものではありません)
- 勤務時間
-
■フレックスタイム制(コアタイム13:00~20:00)
基本労働時間は1日8時間で、勤務時間は以下の3つのパターンから選択可能です。
①11:00~20:00
②12:00~21:00
③13:00~22:00休憩時間:60分 ※時間は業務の都合により各々の自主性に任せています
平均残業時間:平均10〜20時間/月
- 休日休暇
-
・完全週休2日制(土・日)
・祝日
・年末年始休暇
・夏季休暇:3日
・有給休暇(入社時10日付与)
・特別(慶弔)休暇
※年間休日120日 - 諸手当
-
通勤交通費(全額支給)
- 昇給・昇格
-
昇給査定:年2回(4月、10月)
- 保険
-
社会保険完備(雇用・労災・健康・厚生年金)
※全国健康保険協会加入 - 雇用関係
-
無期雇用
- 試用期間
-
3カ月(待遇の変更はありません)
◆3つの先進技術で、世界初のリアルタイムビデオチャットAIを実現!エンジニアとして他社では経験できないスキルが身につきます!
①独自のVideoGen技術(外見)
当社では最先端のAI技術を学び、リアルな外見と自然な動きを持つAIアバターを実現しています。OpenAI社の動画生成AI「sora」にも使用されているCNN(Convolutional Neural Network)を活用して、生身の人間のような外見を生成。さらに、当社が独自に開発した世界初の「リアルタイムリップシンクビデオ生成」技術により、まるで人間が話しているような唇の動きを再現できます。
また、生成されたモーション映像はGAN(Generative Adversarial Network)技術を用いて補正され、さらに高品質でリアルな表現が可能に。これまでにない次世代のビジュアル体験を提供しています。
②LLM生成AI(記憶)
LLM(Large Language Models)を活用した生成AIにより、自然で適切な会話体験を提供しています。RAG(Retrieval-Augmented Generation)システムを導入することで、会話内容の品質を劇的に向上させ、ユーザーとの対話をより深く、個別化されたものに進化させています。
このシステムは、ChatGPTの生成AIエンジンを基盤としつつ、独自のエンジンとユーザーごとのデータベースを組み合わせて会話内容をカスタマイズします。その結果、まるで親友や恋人のように、心で通じた対話相手としてユーザーの生活に寄り添う存在となることを目指しています。
③TTS技術(会話)
TTS(Text-to-Speech)技術を活用し、人間そっくりの自然な音声生成を実現。Google Cloud TTSやMicrosoft Azure TTSなど一般流通の音声生成技術をベースに、当社独自の改良をおこなうことで、さらに高品質な音声表現を可能にしました。
また、大規模言語モデル(LLM)とGAN(Generative Adversarial Network)技術を学び、感情表現、トーン、リズムといった音声の繊細なニュアンスを再現しています。人間の音声に忠実でていねいな音声を生成することで、感情豊かなコミュニケーションを取ることができます。
