データ活用・データ連携のお役立ちコラム
データ活用・データ連携のお役立ちコラム
DXへの取り組みが進む中、今データ連携に注目が集まっています。
スクラッチ開発が当たり前だった時代には、データ連携はシステム開発の“鬼門”でした。そのパターンはシステム間でのデータやり取りや、複数のデータソースから複数ファイルに出力するケースまで多岐に渡り、同時にフォーマットや文字コードを大きく変換しなければならないなど処理も複雑化しています。特に業務システムのマイグレーションやリプレースにおいては、新旧システムのデータ連携・移行などでも、信頼性や安全性の確保が必須となり、その難易度が上がります。何か対策方法はないのでしょうか。
本コラムでは、データ連携を解説するとともに、そのメリット・デメリット、基盤構築方法を徹底解説します。
データ連携とは、複数のアプリケーションやシステム、異なるデータソースの間でデータをつなぎ、効率的に活用するための仕組みやプロセスのことです。企業内に分散したデータを連携し活用することで、業務効率化や意思決定の改善、コスト削減、顧客満足度の向上といった様々なメリットを得られます。企業が保有しているデータは、さまざまなシステムに分散して存在しています。たとえば、顧客情報システム、営業支援システム、販売管理システム、生産管理システム、会計管理システムといった具合です。これらのシステムには“重複する”データ項目もあれば、データを合わせみることで初めてわかる“気づき”もあります。データを連携することで、ムダを省いたデータの管理や分析などが可能になります。つまり、業務効率向上や意思決定の改善につながります。それだけでなく、さまざまなメリットが享受できます。
上記でも述べたとおり、データ連携の大きな目的は、業務効率向上や意思決定の改善にあります。前者の観点では、たとえば、営業支援システムと顧客管理システムを連携させることで、営業担当者は顧客の最新情報をひと目で把握できるようになります。後者の観点では、たとえば、顧客データと売上データを連携させることで顧客の購買傾向を分析することができ、より実効力のあるマーケティング施策を立案できます。連携させるデータソースをさらに広げて分析すれば、そこから新たなビジネスチャンスを発見できるかもしれません。
また、コスト削減効果も望めます。データの重複管理や保管が不要になるからです。ほかにも、在庫管理システムと物流管理システムを連携させることで在庫の適正化が実現し、倉庫スペースが有効に活用できるようになるといった利点も考えられます。
そのほか、顧客体験の向上を図ったり、法的コンプライアンスを遵守するという意味でも、適切にデータ連携を行うことは非常に重要です。
では、データ連携を行う具体的なメリットというのはどこにあるのでしょうか。データ連携を行うメリットは、「複数のデータを組み合わせて活用できる」「データを一元管理できる」「整合性のとれたデータの利用が可能になる」という3点にあります。それらが一体どのようなことを意味しているのか、以下にそれぞれの詳細を紹介します。
企業内の異なるデータソースを統合的にとらえ、複数のデータをシームレスに組み合わせることが可能になります。これにより、分断されていたデータが自在に連携できることになり、その価値に相乗効果が生まれます。「三人寄れば文殊の知恵」といいますが、まさにデータも同様です。1種類より2種類、2種類より3種類とデータを組み合わせていくことでより深い洞察が得られ、その結果、確度の高いアクションが取れるようになります。
膨大なデータを一元的に管理することが可能になります。データの重複や矛盾を回避できるとともに、統一されたデータセットを維持できる、データの整合性が保てる、といった利点を享受できるようになります。たとえば、顧客情報が異なるデータベースに散在しているような場合、データ連携を行えばこれらを一つのプロファイルとしてまとめ上げることができます。統一された詳細な顧客像を描けるようになり、データの検索や参照、更新などの作業も効率化されます。
異なるシステム間でデータをリアルタイムに共有することができるため、データの整合性を保つことが容易になります。整合性が保たれると、データへの信頼性が高くなり、データを最大限に活用した、確度の高い意思決定や分析を行いやすくなります。また、業界で競争優位を獲得・維持するための戦略的な方針策定にも寄与するとともに、ビジネスプロセスそのものも大きく効率化されます。結果的に、顧客体験も向上し、顧客満足度の向上にもつながっていきます。
一方で、データ連携を行うことでのデメリットや課題も存在しないわけではありません。主要なものとしては、「データの加工に手間がかかる」「他のシステムとの連携が難しい」「セキュリティリスクがある」といった点があります。それぞれどのようなことを意味しているのでしょうか。具体的に見ていきましょう。
異なるデータソースや異なる形式のデータを統合する際には、データを加工したり、変換したりといった作業が必要になります。また、データ品質に問題があるようであれば、その調整を図らなければなりません。こうしたデータの事前加工作業は、スクラッチ開発の場合、専門的な知識やスキルが必要な上に、時間と手間がかかります。特に、膨大なデータや複雑な構造のデータを扱うケースでは、加工作業はより複雑化し、プロセス全体の遅延やエラーのリスクが高まります。
異なるシステム間でデータを共有するには、やりとりするためのインターフェースを設定する必要があります。しかし、システムの種類やバージョン、設定などによっては、データ連携するのが難しいケースがあります。たとえば、レガシーシステムと最新のシステムを連携する場合、連携するシステムのAPIやインターフェースが大きく異なるため、実現の難易度が上がります。さらに、異なるシステムが異なるアップデートサイクルを持つといったことも、連携プロセスの維持を妨げます。
データ連携では、複数のシステム間でデータがやり取りされます。不適切なアクセス権や脆弱性のある認証手段が存在すると、悪意のある者がシステムに侵入し、データの漏洩や、改ざんされるリスクが高くなります。また、データ連携に関連するシステムのどこかに問題が発生した場合、予期せずサービスが中断してしまう可能性があります。これはシステムダウンを誘発し、ビジネスに損害を与える可能性があります。
データ連携・移行の処理をスクラッチで開発する問題は大きく「生産性/開発効率」と「品質」の2つに集約できます。
データ連携・移行処理プログラムは、プロジェクトごとにスクラッチ開発しているので、自社内で類似したプログラムを開発している場合が多い、という話をSIerからよく伺います。また、このようなプログラムは、プロジェクトごとに開発言語が異なるなど、再利用するには複数言語に精通した知識・スキルのある人しか使えず、人材の育成・確保が難しくなります。さらに、プログラムのメンテナンスもソースコードを解析しなければならず、保守性の面からも再利用・横展開は困難なケースも多いようです。
このような類似した処理プログラムを個別に開発していては、工数の増大やコスト増につながっていきます。特にデータ移行では1回使って終わりにもかかわらず、毎回イチから開発しているのでは生産性の向上・効率化は図れないのが現状です。
スクラッチ開発されたプログラムの品質はエンジニアのスキルに依存するため、一定の品質を担保するのは困難です。また、コーディング方法によっては限られた時間で移行や連携を完了させる処理性能がだせず、その結果、テストとチューニングを繰り返す事態になりかねません。このように、短納期と品質向上の両立を求められる開発現場には限界がきています。
自由度が高く、個別要件も取り入れやすいスクラッチ開発は魅力的です。しかし、スクラッチ開発に頼った状況は限界を迎えつつあります。IT業界でもエンジニアの人手不足は続いており、特にスキルのあるエンジニアを確保するのは困難です。さらに、顧客からはコストダウンとともに、品質向上・短納期の要望も強くなっています。
状況を改善するにも「スクラッチ開発ベース」を変えないのでは、開発プロセスの大幅な効率化は図れません。「なんでもかんでもスクラッチ」の状況から脱却することも視野に入れた、抜本的な解決策が必要です。
この解決策として期待されるのが「データ変換ツール」です。これは、システム間のデータ連携で必要となるデータ変換や加工処理をGUIベースで実現できるツール。スクラッチ開発が不要で、言語の知識がなくても利用できるため、社内での横展開や再利用も容易です。また、ツールを利用すれば、スキルに依存せずに基本的な品質を担保できるため、生産性とともに安定した品質の確保にも大きな効果を期待できます。これにより、スキルのあるエンジニアには、顧客が満足する設計、上流工程に注力してもらうことで、プロジェクト全体の価値向上にもつながります。
言語に依存しない、設定したデータ変換定義を横展開できるなどメリットの多い「データ変換ツール」ですが、開発現場への導入がスムーズに進むとは限りません。その理由として、「ツールの使い方を覚えなければならない」「ツールの仕様の範囲でしか作れず、スクラッチ開発は自由度が高い」「開発方法を変えたくない」などが挙げられます。
しかし、「データ変換ツール」の活用は、コスト、生産性/開発効率、品質という顧客からの3つの要望すべてに応えられる解なのです。
データ連携ツールとしては、ETLツール、EAIツール、RPA、APIを活用した手法が一般的です。これらのツールをうまく使いこなすことで、企業が目的とするデータ連携が実現しやすくなります。
ETLとは、データを抽出(Extract)・変換(Transform)し、DWHのDBやデータマートに書き出す(Load)といった一連の処理のことで、従来、こうしたETLプロセスはプログラミングにより実現されていましたが、その作業は膨大な工数を要します。そのため最近では、複数システムから必要なデータを抽出、変換・加工し、DWHへ橋渡しするという一連のプロセスを効率化するためのETLツールが注目されています。
EAIとは、複数の異なるシステムを連携させることで、各々のデータやプロセスの統合を目指す概念です。
これまで、システムやデータの連携を実現するには、インターフェースやプログラムを個別に開発する必要がありました。この手法だと、各システムに改修やバージョンアップが必要になると、そのつど改修しなければなりません。そのため、このEAIという工程には多大な工数とコストが発生していました。しかし、データやプロセスの統合に必要な機能を搭載しているEAIツールによって、スムーズなデータ連携が実現されています。
RPA(Robotic Process Automation)は、PC上で行う定型的な業務を自動化するシステムです。ソフトウェアロボットとも呼ばれています。人間の行うルーチン作業を自動化する技術として知られていますが、異なるシステム間でデータを共有するためのインターフェースを設定することも可能です。具体的な強みとしては、データの抽出と整形、データの転送と同期、反復的な作業の自動化といったものがあります。ただし、導入する場合には、利用元システムのセキュリティやデータの機密性に留意して適切な設定を行うとともに、常時モニタリングを行える体制の確立が必要です。
API(Application Programming Interface)は、異なるソフトウェアアプリケーションやシステム間で情報を交換するためにインターフェースを提供するテクノロジーです。連携するシステムのAPIを利用して、データの抽出、変換、ロードなどの処理を行うことができます。特に、APIを使用することで、異なるシステム間でリアルタイムにデータを取得できること、標準化されたデータ形式を用いることにより、異なるシステムが共通の形式でデータをやり取りできるようになる点は大きなメリットです。ただし、API提供元のシステムに障害が発生した場合、利用側では対処することができません。また、API提供元で仕様が変更された場合、利用する側はそれに対応するため修正作業が必要になります。
データ連携は、企業にとって業務効率化や意思決定の改善、コスト削減、顧客満足度の向上といったメリットをもたらす重要な取り組みです。その一方で、大きな戦略なしに取り組むと、データの加工に時間がかかったり、開発が暗礁に乗り上げたり、セキュリティリスクにさらされたりといったデメリットや課題にも直面します。特に、スクラッチ開発に依存した体制は見直しをかけた方がよく、自社の状況や目的に合わせて、最適なデータ連携ツールや方法を選択することが重要です。
メインフレームからオープン環境への国民健康保険システム移行
PC1台で数千万件のデータ変換を13時間で可能としたRACCOON
数TBに上るメインフレームデータのオープン移行
16時間でデータ変換を完了したRACCOON
EDIシステムの刷新をきっかけに
ACMS Apex + RACCOONで、グループ全体のデータ連携基盤を実現
基幹システム製品のクラウド化で求められたデータ移行工程の見直し
RACCOONで精査が必要なデータを簡単かつ高品質に移す体制を確立
めざしたのは4通販サイトへのデータ提供の自動化
RACCOON導入で情報の精度・スピードが一気に向上
基幹EDIインフラをAS/400からAWSへ
ACMS Apex、RACCOONが短期開発に貢献