ข้อมูลทุติยภูมิที่เผยแพร่บนอินเทอร์เน็ต มีอยู่หลากหลายรูปแบบ การพิจารณาความเหมาะสมของแหล่งข้อมูล สามารถใช้มุมมองทั้ง 5 ด้าน ได้แก่ ความทันสมัยของข้อมูล ความสอดคล้องกับการใช้งาน ความน่าเชื่อถือของแหล่งข้อมูล ความถูกต้องแม่นยำ และจุดมุ่งหมายของแหล่งข้อมูล ก่อนที่จะนำข้อมูลมาใช้งานจะต้องมีการจัดเตรียมข้อมูล (data preparation) เพื่อเตรียมพร้อมสำหรับการประมวลผล ประกอบด้วย การทำความสะอาดข้อมูล (data cleansing) การแปลงข้อมูล (data transformation) และการเชื่อมโยงข้อมูล(combining data) การสำรวจข้อมูล (data exploration) เป็นการทำความเข้าใจเพื่อพิจารณาภาพรวมของข้อมูล โดยอาจใช้แผนภาพ หรือกราฟของข้อมูลในรูปแบบต่าง ๆ ระหว่างการสำรวจ อาจจะพบข้อผิดพลาดหรือปัญหาอื่น ๆ จากการตั้งคำถาม หรือการรวบรวมข้อมูล ซึ่งทำให้ต้องกลับไปดำเนินการแก้ไขให้ถูกต้อง เครื่องมือที่ใช้ในการสำรวจข้อมูลอาจใช้โปรแกรมสำเร็จรูป หรือการเขียนโปรแกรมภาษา