2 dự án dữ liệu lớn với Tổ chức tài chính top 6 Việt Nam

2 du an du lieu lon voi to chuc tai chinh top 6 viet nam

Trong bối cảnh công nghệ số phát triển mạnh mẽ, dữ liệu được coi là tài sản có giá trị đối với mọi tổ chức. Việc xử lý hiệu quả lượng dữ liệu khổng lồ là điều kiện cần thiết để các doanh nghiệp nói chung, các tổ chức tài chính nói riêng, cạnh tranh hiệu quả. Chính vì thế, việc hợp tác cùng một đối tác công nghệ tin cậy là vô cùng cần thiết.

EVOTEK và đối tác là ví dụ điển hình về mối quan hệ hợp tác bền chặt để xây dựng các giải pháp xử lý dữ liệu hiệu quả. 2 dự án thành công của hai bên trong lĩnh vực tối ưu hóa, tích hợp, phân tích và quản trị dữ liệu chứng tỏ năng lực và kinh nghiệm dày dặn của EVOTEK

1. Dự án Phân tích dữ liệu chương trình ưu đãi

Dự án được thực hiện nhằm mục đích phân tích dữ liệu khách hàng doanh nghiệp tham gia chương trình ưu đãi. Dự án tập trung vào việc xây dựng kho dữ liệu (data warehouse) để tích hợp dữ liệu từ các nguồn khác nhau, sau đó phân tích dữ liệu để hỗ trợ ra quyết định cho khách hàng.

du an phan tich du lieu chuong trinh uu dai

Hạng mục: Data Analytics Data Warehouse
Chuyên môn: IBM DataStage IBM Netezza

Hiện trạng

 • Khó khăn trong việc thu thập, tích hợp dữ liệu từ nhiều hệ thống thông tin khác nhau của tổ chức do tính phân tán, đa dạng của các nguồn dữ liệu.
 • Chất lượng dữ liệu đầu vào có thể ảnh hưởng đến hiệu quả của các mô hình phân tích, khiến kết quả không đạt như mong đợi.
 • Nghiệp vụ phức tạp, thường xuyên thay đổi trong chương trình ưu đãi có thể dẫn tới nhiều lần cập nhật, điều chỉnh quy trình xử lý dữ liệu.

Thách thức

 • Thu thập và làm sạch sẽ hàng terabyte dữ liệu không đồng nhất từ nhiều nguồn.
 • Công tác làm sạch, chuẩn hóa dữ liệu tốn nhiều thời gian và công sức.
 • Nghiệp vụ phức tạp thường xuyên thay đổi, đòi hỏi phải liên tục cập nhật quy trình ETL và mô hình phân tích.
 • Tính bảo mật cao của dữ liệu khách hàng trong ngành tài chính. Các giải pháp công nghệ cần đảm bảo an toàn thông tin tuyệt đối.

Thực hiện dự án

 • Xây dựng quy trình ETL (Extract – Transform – Load) để chiết xuất, biến đổi và tải dữ liệu từ nhiều nguồn khác nhau vào kho dữ liệu trung tâm. Quy trình được thiết kế để đảm bảo tính nhất quán và chất lượng của dữ liệu.
 • Phát triển các mô hình và thuật toán phân tích dữ liệu nhằm hỗ trợ ra quyết định và cá nhân hóa dịch vụ cho khách hàng. Mô hình và thuật toán được xây dựng dựa trên hiểu biết sâu sắc về ngành tài chính và nghiệp vụ ưu đãi.
 • Tích hợp, vận hành các giải pháp phân tích và khai thác dữ liệu trên nền tảng công nghệ hiện đại bao gồm IBM DataStage, IBM Netezza.

Kết quả dự án

 • Xây dựng thành công kho dữ liệu (data warehouse) tích hợp thông tin khách hàng doanh nghiệp tham gia các chương trình ưu đãi từ nhiều nguồn dữ liệu khác nhau.
 • Thu thập và xử lý thành công hàng terabyte dữ liệu.
 • 100% dữ liệu được làm sạch, chuẩn hóa và tích hợp thành công vào hệ thống kho dữ liệu để phục vụ phân tích.
 • Xây dựng thành công các mô hình phân tích, học máy với độ chính xác cao cho phép đưa ra các dự báo và khuyến nghị về ưu đãi.
 • Hoàn thành kết nối và tích hợp thành công dữ liệu phân tích vào hệ thống quản lý khách hàng nhằm hỗ trợ ra quyết định.
 • Nâng cao hiệu quả bán hàng đối với các sản phẩm ưu đãi, đem lại lợi ích kinh tế lớn cho tổ chức.

2. Dự án Data Lake: Hợp nhất Dữ liệu Khách hàng

Với số lượng nhà phân phối cấp dưới tương đối lớn, việc quản lý dữ liệu khách hàng là một nghiệp vụ không hề đơn giản. EVOTEK là đơn vị được tin tưởng giao trọng trách Hợp nhất dữ liệu khách hàng trên toàn thể quy mô của công ty chủ quản. Đồng thời EVOTEK thực hiện các nghiệp vụ phân tích dữ liệu kinh doanh trên tập dữ liệu hợp nhất này.

du an data lake hop nhat du lieu khach hang

Hạng mục: Data Analytics Data Warehouse
Chuyên môn: HDFS, Spark, Kafka Oracle, Postgre Tableau, Airflow Netezza

Hiện trạng

Mỗi nhà phân phối đều đang quản lý dữ liệu khách hàng riêng lẻ, dẫn đến tình trạng dữ liệu bị phân tán, khó khăn trong việc thực thi các chiến dịch tiếp thị chéo giữa các nhà phân phối với nhau.

Thách thức

 • Sự phức tạp về mặt hệ thống CNTT: Việc hợp nhất các hệ thống CNTT phân tán và không thống nhất giữa các nhà phân phối là thách thức lớn, đòi hỏi nhiều nỗ lực về tích hợp hệ thống.
 • Sự khác biệt về mô hình dữ liệu: Cách lưu trữ và mô hình hóa dữ liệu khách hàng tại các nhà phân phối là rất khác nhau, gây khó khăn trong việc đồng bộ và tổng hợp dữ liệu.
 • Sự phản kháng từ các bộ phận kinh doanh: Một số nhà phân phối e ngại việc chia sẻ dữ liệu khách hàng nhạy cảm với tập đoàn.
 • Nhân lực có kỹ năng dữ liệu: Đòi hỏi phải bổ sung đội ngũ nhân sự am hiểu công nghệ dữ liệu để vận hành các hệ thống sau khi dự án hoàn thành

Thực hiện

 • Evotek hợp nhất toàn bộ dữ liệu khách hàng từ các nhà phân phối của Tập đoàn vào một Data Lake duy nhất. Data Lake sẽ được xây dựng dựa trên công nghệ HDFS và được tích hợp với các công nghệ xử lý dữ liệu lớn như Spark, Kafka.
 • Dữ liệu khách hàng được hợp nhất và lưu trữ tập trung, các ứng dụng phân tích như Tableau sẽ được sử dụng để phân tích và trực quan hóa dữ liệu, hỗ trợ ra quyết định. Hệ thống ETL sẽ được xây dựng dựa trên Airflow để định kỳ đồng bộ dữ liệu từ các nguồn dữ liệu gốc (Oracle, Postgres, Netezza) vào Data Lake.

Kết quả

Thành công xây dựng tập dữ liệu khách hàng thống nhất của toàn bộ hệ thống. Giúp cá nhân hóa trải nghiệm và cung cấp dịch vụ phù hợp cho mỗi khách hàng. Nâng cao đáng kể sự hài lòng và trung thành của khách hàng với thương hiệu.

 

Content