Theo thống kê của tập đoàn iGroup, số liệu công bố khoa học trên thế giới liên tục tăng mạnh. Chẳng hạn năm 2002 có 1,09 triệu công bố khoa học, năm 2007 có 1,58 triệu công bố và đến năm 2010 là 1,9 triệu công bố. Đi cùng với sự gia tăng này là các sai phạm trong công bố nghiên cứu khoa học. Theo iGroup, khoảng 23% tạp chí hàng đầu thế giới từ chối đăng các công trình nghiên cứu mà họ phát hiện đạo văn. Việc sai phạm này bao gồm: đạo văn, đạo ý tưởng, lỗi nhà nghiên cứu, làm giả hay sai lệch thông tin. Dự án CrossCheck, năm 2011 thu hút sự tham gia của 283 tạp chí khoa học hàng đầu, hàng năm kiểm tra được 2,3 triệu bản thảo và đã phát hiện 10 triệu nội dung trùng lặp. Việc điều tra sai phạm, đạo văn gây nhiều tốn kém: năm 2011-2012, ở Hoa Kỳ, tổng chi phí cho các cuộc điều tra như vậy tốn 110 triệu USD.
Về tra cứu trùng lặp của các đề tài nghiên cứu khoa học, cho đến nay tại Việt Nam đã kiểm soát phần nào thông qua CSDL KH&CN Quốc gia, dựa vào các nhiệm vụ KH&CN đã được giao nộp tại Cục Thông tin KH&CN quốc gia và ở các tỉnh, thành phố. Tuy nhiên, việc “quét” sự trùng lặp trên bình diện quốc tế thì hiện Việt Nam chưa làm được. Nói cách khác, chúng ta mới chỉ làm được phần trong nước. Do vậy, phần mềm mà iGroup đưa ra tại buổi giới thiệu này là một công cụ để ngoài việc kiểm tra trùng lặp các nhiệm vụ KH&CN trong nước, còn kiểm tra sự trùng lặp với các nghiên cứu nước ngoài. Chẳng hạn các ý tưởng, nội dung nghiên cứu nào đó ở trong nước đã có ở đâu trên thế thới.
iThenticate cung cấp công nghệ chuyên phát hiện và phòng chống đạo văn được các NXB học thuật, viện nghiên cứu sử dụng rộng rãi nhằm đảm bảo tính nguyên gốc của công trình nghiên cứu trước khi được xuất bản. iThenticate giúp ngăn ngừa hành vi đạo văn sai trái thông qua việc so sánh bản thảo với các cơ sở dữ liệu của iThenticate . Có 52 tỷ trang web trên Internet được lưu trữ trong 10 năm. Mỗi ngày iThenticate thực hiện quét hơn 10 triệu trang web, 42 triệu bài tạp chí, kỷ yếu hội nghị và sách qua dịch vụ CrossCheck cung cấp bởi iThenticate từ 530 NXB Khoa học, Công nghệ & Y học (STM). Ngoài ra, iThenticate có 93 triệu dữ liệu nghiên cứu đặt mua trực tuyến và không trực tuyến từ 30 đơn vị hợp tác cung cấp dữ liệu, cơ sở dữ liệu hàng đầu.
Buổi giới thiệu hệ thống phát hiện trùng lặp trong nghiên cứu khoa học - iThenticate của Tập đoàn iGroup đã mở ra triển vọng hợp tác và ứng dụng hệ thống này tại Cục thông tin KH&CN quốc gia trong thời gian tới./.