Ketika orang membahas skala e-commerce, mereka selalu fokus pada tantangan teknologi besar seperti pencarian terdistribusi, inventaris, dan mesin rekomendasi. Tetapi yang benar-benar membuat setiap platform e-commerce pusing adalah masalah paling dasar: inkonsistensi nilai atribut produk.
Nilai atribut mendorong seluruh sistem penemuan produk. Mereka mendukung penyaringan, perbandingan, peringkat pencarian, dan logika rekomendasi. Namun dalam katalog produk yang nyata, nilai atribut jarang bersih dan rapi. Pengulangan, format yang acak, dan makna yang ambigu adalah hal yang umum.
Lihatlah atribut "ukuran" yang tampaknya sederhana: ["XL", "Small", "12cm", "Large", "M", "S"]
Lalu lihat "warna": ["RAL 3020", "Crimson", "Red", "Dark Red"]
Sekilas, kumpulan ini tampaknya tidak masalah, tetapi ketika Anda memiliki lebih dari 3 juta+