Seiring dengan semakin matangnya perusahaan-perusahaan AI, persaingan untuk mendapatkan data berkualitas tinggi telah menjadi salah satu bidang yang paling kompetitif di industri ini, dengan meluncurkan perusahaan-perusahaan seperti Mercor, Surge, dan, yang paling menonjol, Scale AI milik Alexandr Wang. Namun kini setelah Wang beralih menjalankan AI di Meta, banyak pemberi dana melihat adanya peluang – dan bersedia mendanai perusahaan dengan strategi baru yang menarik untuk mengumpulkan data pelatihan.
Lulusan Y Combinator kurva data adalah salah satu perusahaan tersebut, yang berfokus pada data berkualitas tinggi untuk pengembangan perangkat lunak. Pada hari Kamis, perusahaan mengumumkan putaran Seri A senilai $15 juta, dipimpin oleh Mark Goldberg di Chemistry dengan partisipasi karyawan di DeepMind, Vercel, Anthropic, dan OpenAI. Seri A hadir setelah putaran awal senilai $2.7 juta, yang menarik investasi dari mantan CTO Coinbase Balaji Srinivasan.
Datacurve menggunakan sistem “pemburu hadiah” untuk menarik insinyur perangkat lunak yang terampil untuk menyelesaikan kumpulan data yang paling sulit didapat. Perusahaan membayar kontribusi tersebut, sejauh ini telah mendistribusikan lebih dari $1 juta dalam bentuk hadiah.
Namun salah satu pendiri Serena Ge (gambar di atas bersama salah satu pendiri Charley Lee) mengatakan motivasi terbesar bukanlah finansial. Untuk layanan bernilai tinggi seperti pengembangan perangkat lunak, bayaran untuk pekerjaan data akan selalu jauh lebih rendah dibandingkan pekerjaan konvensional — jadi keunggulan terpenting perusahaan adalah pengalaman pengguna yang positif.
“Kami memperlakukan ini sebagai produk konsumen, bukan operasi pelabelan data,” kata Ge. “Kami menghabiskan banyak waktu untuk memikirkan: Bagaimana kami dapat mengoptimalkannya sehingga orang-orang yang kami inginkan tertarik dan masuk ke platform kami?”
Hal ini sangat penting karena kebutuhan data pasca pelatihan semakin kompleks. Meskipun model sebelumnya dilatih menggunakan kumpulan data sederhana, produk AI saat ini mengandalkan lingkungan RL yang kompleks, yang perlu dibangun melalui pengumpulan data yang spesifik dan strategis. Seiring dengan berkembangnya lingkungan yang semakin canggih, kebutuhan data menjadi semakin ketat baik dari segi kuantitas maupun kualitas — sebuah faktor yang dapat memberikan keunggulan bagi perusahaan pengumpulan data berkualitas tinggi seperti Datacurve.
Sebagai perusahaan tahap awal, Datacurve berfokus pada rekayasa perangkat lunak, namun Ge mengatakan model tersebut dapat diterapkan dengan mudah pada bidang seperti keuangan, pemasaran, atau bahkan kedokteran.
acara Techcrunch
San Fransisco
|
27-29 Oktober 2025
“Apa yang kami lakukan saat ini adalah menciptakan infrastruktur untuk pengumpulan data pasca pelatihan yang menarik dan mempertahankan orang-orang yang sangat kompeten di bidangnya masing-masing,” kata Ge.