こんにちは。エーサース採用チームの永井です。
いくつかの研究機関やメディアは、税理士の仕事は近い将来AIに奪われてしまう可能性が高いと主張しています。仕訳のような複雑なデータの処理は機械が得意とするところで、実際に税理士の仕事を助けるITサービスがどんどん登場しています。そんな中、「いい税理士」を支援したいというエーサースのビジョンに共感し、1人のデータサイエンティストが新たにジョインしました。
現在は東京大学や大阪府立大学などで研究員や講師を勤めながら、エーサースの事業企画グループのデータサイエンティストとして活躍する西口さんのインタビューをお送りします!
******************************************
[本日のインタビュイー]
-名 前 西口 真央
-勤務年数 5ヶ月
-部 署 事業企画グループ
-経 歴 博士(経済学)。ソーシャルゲームやHRTech、FinTechなどビッグデータを活用するベンチャー企業に勤めながら、大阪府立大学大学院経済学研究科 博士後期課程を修了。データ解析コンペティションでの受賞や、知識マネジメント系の国際カンファレンスでのPaper Awardなど、データサイエンス×ビジネスの領域で多数の受賞を経験。データマイニングや機械学習技術の社会実装を専門領域としており、現在はエーサースに加えて東京大学や大阪府立大学の研究員や、東京理科大学の講師を兼任する。
************************************
エーサースに関わるまでのキャリアを教えてください
私は大学院2年を経て正社員として就職しまして、ソーシャルゲームや就職情報サイト、金融取引データなどを対象として、主にデータ分析や機械学習システムの開発をメインで行ってきました。時には新規事業の企画や、サービスの施策立案を行うこともありました。
また、就職と同時に博士課程にも進学し、データサイエンス技術のビジネス活用に関する研究も行っていました。具体的には、人の意思決定を支えるツールとして、可読性が高く予測性能もそこそこ高い予測アルゴリズムを開発したり、データサイエンスを用いて実際のビジネス課題に取り組む事例研究に従事していました。
現在は東京大学、大阪府立大学、東京理科大学の研究員や講師を兼任しながらエーサースのデータサイエンティストとして働いています。
大学ではどんな研究に携わっていますか
東京大学では、最近問題になっている「SNS上での未成年者の誘い出し」を抑制するための研究に携わっています。未成年者が悪意を持った成人に誘い出されて犯罪に巻き込まれる事犯を未然に防ぐために、リスクの高いユーザーを未然検知するシステムを主に開発しており、大手SNSを運営する会社などからデータを提供いただいて共同研究という形で進めています。このような課題は社会的には大きな意義があるものの、企業からすると利益に直結しにくいため、大きく予算を割けない事情があります。そのため、研究者として腰を据えて取り組めることに、大きなやりがいを持っています。
この研究では、私はシステムのコアとなるロジックや機械学習アルゴリズムの開発と実装、実験環境の構築、numpyやscikit-learnなど利用するライブラリの選定を担当しています。開発中のシステムは、サーバー側から「このユーザーIDの危険度を判定してくれ」とリクエストを受けると、過去の行動データによって学習された予測モデルがリスクを確率的に計算し、判定結果をサービス側に送るものです。近年のSNSには会話コーパスやユーザ属性、ソーシャルネットワークなど、様々な種類のデータが蓄積されており、これらのデータを統合的に利用したモデルを構築することはチャレンジングなテーマです。
大阪府立大学での研究はよりビジネスライクなもので、ディスカウントストアの保有する位置情報データや購買ログデータの有効な活用方法を、マルチエージェントシミュレーションや移動パターン抽出などの技術を用いて模索しています。この研究の面白いところは、購買アクションに到るまでのユーザの"迷い"を検知できるところです。購買パターンに加え、立ち止まる商品棚の傾向が明らかになれば、より適切なタイミングで商品推薦が可能になると期待しています。
ちなみに、2つの研究を比較すると、SNSの誘い出し抑制プロジェクトは「より高い精度で当てれば良い」という形で、目的や基準が明確なので取り組みやすいです。もう一方のプロジェクトは、活用方法そのものから模索しているので難しくはありますが、それがまた楽しいですね。
データサイエンティストとして活躍をしながら、研究活動を続ける理由とは
個人的な感情の話をすると、企業で働くことと研究活動では考え方や着地点が異なるため、どちらにも違った面白さがあります。
企業で働く場合、今ある技術とニーズを把握し、社会に対して明確な価値をサービスとして提供する必要があります。プレッシャーはかかりますが、社会とリンクしている実感を得ることができます。異なる職業の人と関わることも多いので、私にとってはそれも刺激的です。研究の場合は、もちろん有用性も考慮しますが、私はどちらかというと新規性を重視して取り組んでいます。まだ世の中にない技術や、明らかにされていないテーマについて深く考えていきます。その際は純粋な知的好奇心を大切にしています。ただ、基本的に1人で行っているので少し寂しいです。(笑)
私はどちらの活動も好きなので、現在は両方に関われるような働き方をしています。
データサイエンティストという職業について教えてください
データサイエンティストやデータエンジニアなど様々な呼ばれ方がありますが、いずれも厳密には違う職種だと思っています。データサイエンティストは蓄積されたデータの分析やアルゴリズムの設計・開発を担当し、データエンジニアはデータ活用を推進するためのインフラ環境を構築・運用するような棲み分けでしょうか。
私はデータサイエンティストとして、膨大なデータから宝の山を見つけるデータマイニングと、機械学習システムの設計・実装という、二つの領域を得意としています。そのため、データエンジニアとしてデータベース部分を開発するところは、優秀なエンジニアに任せて、お互いの強みを活かせるような関係が理想ですね。
よくある課題という意味では先程お話した不正ユーザーの判定や、3日後もサービスの利用を継続するか離脱するかを予測するような分類問題を取り扱うことが多いですね。とにかく高精度で当てれば良い問題であれば、ランダムフォレストや勾配ブースティング、スタッキングなどのアンサンブル学習や、いわゆるディープラーニング系の手法のような、高パフォーマンスな手法をよく利用します。
ただ、意思決定するのは最後は人です。ビジネスアクションまで繋げるためには、人が解釈可能な分析も必要になってくるケースが多いです。例えば、継続顧客と離脱顧客を高精度で予測できるモデルを構築しても、2つの顧客群にどのような違いがあるのかを説明出来なければ、サービス改善が出来ません。このような分析においては、決定木やアソシエーション分析、頻出パターンなどのいわゆるホワイトボックスな手法を利用します。つまり、ビジネス課題やデータの特徴、ニーズを正確に把握し、適切な分析タスクを設定する能力が、「いいデータサイエンティスト」にとって必須の能力だと考えています。
ここは大事なところなので補足すると、予測コンペで上位入賞したとか、ディープラーニングに詳しいというのは、「いいデータサイエンティスト」の必要条件ではあっても十分条件にはなりません。データをたくさん持っている会社が、これからデータを有効活用しようと思い、このような人材だけを雇ったとしても、おそらく期待した成果は望めないでしょう。「いいデータサイエンティスト」には、今あるリソースを考慮して、ビジネスにおける有用性や実現可能性の観点から適切な要件を定義できる能力も必要となります。
AIによって「いい税理士」を豊かにする
エーサースにジョインしようと思った理由は、まず何より、代表の田中さんはじめ、お会いした方の理念・考え方が素晴らしかったことです。特に、単純に税理士の仕事を奪うAIを作ろうとするのではなく、今ある最先端の技術やAIを活用することで、より高い付加価値を与え、税理士の仕事を更に新しいものに変えていこうという考えは、私が理想とするAI活用の考え方とマッチしていました。
税理士を淘汰するようなAIを作ることもできるかもしれませんが、社会に寄り添わずに作られたものは、多くの反発を招きます。新しい技術が台頭し、人々の価値観やルールが変わり、そこから新たな仕事が再定義されて初めて、既存の仕事が淘汰されるべきだと考えています。やや理想論かもしれませんが、そこが素晴らしいなと感じジョインさせてもらいました。
また、経営陣の方々に共通して感じたことが、人任せにしないと言うか、自らが使命感を持ち自分の責任で人のせいにする事なく動こうとしており、そのようなチームで働きたいと思いました。
他の理由としては、エーサースが保有しているデータが、機械学習・データサイエンスとの相性が非常に良いことが挙げられます。10年間に渡り蓄積された膨大かつ正確な会計データは、非常に希少価値が高いです。データ形式も整っているため、質・量ともにデータサイエンス技術を活用するには最高のデータです。
直近はどのようなことに取り組まれていますか
今まさに、エーサースの保有する大量の会計データを使用して、その仕訳処理の自動化や中小企業が更に成長する為の価値を与える新規事業を一緒に考えている状況です。だいぶ形になってきているものもありますが、それを進めつつ将来のことも見据え、比較的自由にやらせていただいてます。
他には、二週間に一度のペースで、執行役員CPOの上村さん・CFOの山﨑さん・私の三人で、データサイエンスの活用というテーマでディスカッションを行っています。その他にも事業企画メンバーや田中さんを交えたミーティングがあるので、可能な限り出席しています。あとは新規メディアを設計するメンバーとしてもジョインしています。
エンジニアとの関わり方をおしえてください
蓄積されたデータベースにアクセスしなければ作業ができないので、既存データの抽出やデータベースの設計に関する事で関わっています。新規サービスの実装方法についても、これからエンジニア陣と協力しながら固めていきます。
機械学習技術の実装には、エンジニアとデータサイエンティストの連携が非常に重要です。例えば、機械学習モデルの作成のためには、しばしば高負荷な計算処理が伴うため、モデルの精度の観点からはより潤沢な計算リソースが必要です。一方で、Webやアプリケーションエンジニアは、なるべくサーバーに負荷をかけず、サービスの応答速度を重視します。このような職種による方向性の違いがあり、お互いがそれを理解した上で環境構築をしないと、不幸な結果になってしまいます。慎重な議論を進めながら、適切な形に落とし込んでいくことが、エンジニアとの関わりで大切なことだと考えています。
データサイエンティストと同じチームでエンジニアが働く最大のメリットは、エンジニアが作ったものが、実際にどういう効果があったのかをデータで示せることだと思います。恐らくですが、データサイエンティストが不在の環境だと、サービスを開発して一つのゴール、となってしまうことがあるかと思います。ですが、データサイエンティストが関わることで、「今回作った新機能のおかげでユーザーの継続率が5%上昇した」といった成果をリアルタイムに数字で見る事ができるので、自分のエンジニアリングがお客様の喜びやチームの成果にどのように貢献したかがわかり、大きなやりがいに繋がるのではないかと思っています。
エーサースに興味をもってくれたエンジニアさんへメッセージを一言
エーサースもやりたい事はたくさんありますが、もっと人がいればうまく回るのになと思うことが多々あり、もっといろんな人が入ってきてほしいなと思います。どんな方に、という意味だとやはり新しいものに対して寛容な人に来てほしいですね。今自分が持っている技術や知識に固執しない人と働くとやはり楽しいです。こういう新しい技術があって、こういう風に使用できるんじゃないかなどの話が出来る人とは、ぜひ一緒に仕事をしてみたいと思います。
後は、他人のせいにしない・・・自分事として全部捉えて働ける人が望ましいです。特に私が所属している事業企画グループは新しい取り組みを続ける組織です。そのため、うまくいかない事がほとんどです。批判はいくらでもできますが、そうではなく、自ら取り組んで良い成果を出して、自ら望む環境を実現していけるような人と一緒に働きたいです。
いかがでしたか?
ビジネス・学術の両輪で活躍する、データサイエンティスト西口さんのインタビューをお送りさせていただきました。エーサースはいい税理士の皆様を支え、よりよいサービス実現のために、新しい取り組みを続けて参ります。
エーサースの取り組みや今後のロードマップなど、ご興味をお持ちいただけましたらぜひエントリーください!