Pinecone meluncurkan basis data vektor serverless-nya keluar dari preview
Pinecone, startup basis data vektor yang didirikan oleh Edo Liberty, mantan kepala Amazon AI Labs, selama ini selalu berada di garis depan dalam membantu bisnis memperkaya model bahasa besar (LLMs) dengan data mereka sendiri. Baru-baru ini, perusahaan sepenuhnya merancang ulang produknya untuk meluncurkan Pinecone Serverless, yang membebaskan pelanggannya dari harus memikirkan tentang mengelola implementasi mereka dan memperluasnya. Hari ini, Pinecone serverless keluar dari versi beta dan sekarang tersedia secara umum.
Liberty mencatat bahwa pelanggan awal perusahaan sekarang beralih dari bereksperimen dengan AI generatif menjadi ingin meluncurkan produk AI mereka sendiri. Perusahaan melihat perusahaan menghadapi kompleksitas membangun aplikasi baru sambil mencari tahu cara terbaik untuk memasukkannya ke dalam produksi.
“Gelombang pertama aplikasi yang siap di produksi akan segera masuk ke pasar sekarang dan dalam enam hingga sembilan bulan mendatang. Apa yang lebih dari 5.000 pelanggan kami katakan dengan jelas kepada kami adalah bahwa mereka memerlukan alat yang didedikasikan, dioptimalkan, dan berspesialisasi yang sangat bagus dalam melakukan pencarian vektor, melakukan RAG, mengekstraksi pengetahuan, dan menghasilkan konteks untuk model bahasa ini. Apa yang mereka benar-benar katakan adalah: hei, saya memerlukan skala, saya memerlukan kinerja, dan saya memerlukan biaya sehingga saya dapat berpikir tentang produk yang saya bangun.”
Liberty menegaskan bahwa Pinecone menghabiskan banyak waktu untuk membuat produk siap untuk penerapan produksi - semuanya sambil membuatnya jauh lebih terjangkau, juga. Perusahaan sebenarnya percaya bahwa pelanggan yang menggunakan Pinecone serverless dapat mengurangi biaya mereka hingga 50x, sebagian karena tim merancang ulang sistem menjadi layanan multi-penghuni yang memisahkan penyimpanan dan komputasi. Dengan itu, pelanggan Pinecone hanya membayar saat mereka benar-benar menggunakan waktu CPU, dengan perusahaan mengatur kapasitas di backend.
“Karena kami menjalankan segalanya sebagai layanan, kemampuan kami untuk mengatur semua itu membuat kami dapat mengenakan biaya kepada orang untuk tepat apa yang mereka gunakan - dan bukan apa pun yang lebih. Itu sangat langka dan sangat sulit dilakukan,” ujar Liberty.
Selama pratinjau publik, pelanggan Pinecone juga meminta sejumlah fitur tambahan. Salah satunya adalah Private Endpoints, yang diluncurkan dalam pratinjaum publik hari ini. Ini memungkinkan perusahaan membuat koneksi langsung ke awan pribadi virtual mereka di Amazon melalui AWS PrivateLink, yang tidak mengekspos data mereka ke internet publik untuk memastikan data tetap berada dalam berbagai rezhim pengaturan dan kepatuhan yang mungkin harus diikuti oleh sebuah perusahaan.
Beberapa perusahaan yang sudah menggunakan Pinecone serverless termasuk Gong, Help Scout, New Relic, Notion, TaskUS, dan You.com.
“Notion memimpin revolusi produktivitas AI,” kata rekan pendiri dan COO Notion Akshay Kothari. “Peluncuran fitur AI yang pertama di pasaran kami dimungkinkan oleh Pinecone serverless. Teknologi mereka memungkinkan AI Q&A kami untuk memberikan jawaban instan kepada jutaan pengguna, diambil dari miliaran dokumen. Yang terbaik dari semuanya, beralih ke arsitektur terbaru mereka telah memangkas biaya kami sebesar 60%, memajukan misi kami untuk membuat pembuatan alat lunak menjadi hal yang umum.”