Similitud Vectorial Escalable API API ID: 11919

API de Similaridad de Vectores Escalables: Escala fácilmente tus búsquedas de similitud para manejar conjuntos de datos diversos sin comprometer el rendimiento

Usa esta API desde tu agente de IA vía MCP

Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.

Docs y configuración

Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Descripción larga (equilibrada, amigable para el mercado)

API de similitud de vectores escalables es una API de coincidencia difusa y deduplicación de alta velocidad diseñada para datos del mundo real y desordenados Ayuda a identificar registros casi duplicados y reconciliar entidades incluso cuando los valores no coinciden exactamente errores tipográficos diferencias de mayúsculas signos de puntuación faltantes problemas de espacio abreviaturas y cambios menores en el orden de las palabras

En lugar de construir y ajustar su propia canalización de coincidencia difusa envía sus cadenas (o registros) a la API y recibe coincidencias puntuadas en similitud en las que puede confiar Las salidas típicas incluyen pares coincidentes (por ejemplo “Apple” ↔ “apple inc.”) puntuaciones de similitud y resultados estructurados que son fáciles de integrar en flujos de trabajo de limpieza de datos CRM trabajos ETL y canalizaciones de análisis

Casos de uso comunes:

Deduplicar listas: encontrar duplicados dentro de un conjunto de datos (coincidencia todo-a-todo) y devolver pares de duplicados probables
Reconcilia contra una lista maestra: emparejar una lista entrante con un conjunto canónico (lista-a-maestra)
Higiene de datos de CRM y clientes: limpiar prospectos/cuentas/empresas donde los duplicados rompen la información y el alcance
Resolución de entidades y vinculación de registros: conectar referencias a la misma entidad del mundo real a través de las fuentes

Por qué los equipos lo utilizan:

Funciona con texto desordenado desde el primer momento (sin reglas manuales para cada caso especial)
Puntuaciones de similitud para clasificación y umbrales (usted elige cuán estricto ser)
Construido para escalar y automatizar (diseñado para ejecutarse en canalizaciones no solo en scripts puntuales)

Documentación de la API

Endpoints

Dedupe Endpoint ID: 22656

Dedupe es un punto final de coincidencia difusa de todo a todo para encontrar duplicados dentro de una lista única de cadenas. En lugar de comparar solo dos entradas por llamada a la API, envías un conjunto de datos y devuelve pares similares y/o grupos deduplicados en todo el conjunto.

Por qué lo usarías

Aceleración masiva: normalmente ~300× a 1,000× más rápido que los enfoques “regulares” que la gente prueba primero (comparaciones por pares, bucles de puntuaciones difusas, etc.) una vez que superas listas pequeñas.
Limpieza opcional integrada: puedes habilitar la limpieza de texto común (conversión a minúsculas, eliminación de puntuación, ordenamiento de tokens). Esto ahorra horas (o días) de desarrollo + mantenimiento continuo.
Sufijos de empresa manejados automáticamente: terminaciones comunes como “Inc”, “LLC”, “Ltd”, etc. se eliminan para que puedas hacer coincidir el nombre real.

Referencias: similarity-api/blog/speed-benchmarks (1M de registros en ~7 minutos; más rápido que las bibliotecas de coincidencia difusa comunes de Python).

Límites difíciles en Zyla

Máximo 1,000 cadenas por solicitud (aplicado).

¿Necesitas algo más grande / ilimitado?

Usa la versión completa en similarity-api/docs

Parámetros (solicitud POST)

data (requerido)

Una cadena que contiene un array JSON de cadenas.

Valor de ejemplo para data:
["Acme Inc","ACME LLC","Globex GmbH"]

similarity_threshold (opcional, 0.0 a 1.0, predeterminado 0.75)

Mayor = coincidencia más estricta (menos pares). Típico: 0.80–0.90 para deduplicación de empresas.

remove_punctuation (opcional, verdadero/falso, predeterminado verdadero)

Elimina diferencias de puntuación (por ejemplo, “A.C.M.E.” vs “ACME”).

to_lowercase (opcional, verdadero/falso, predeterminado verdadero)

Hace que la coincidencia no distinga entre mayúsculas y minúsculas.

use_token_sort (opcional, verdadero/falso, predeterminado falso)

Ayuda cuando cambia el orden de las palabras (por ejemplo, “Bank of America” vs “America Bank of”).
output_format (opcional, predeterminado string_pairs)

Este punto final puede devolver datos en múltiples formatos. Selecciona uno de los siguientes:
- string_pairs:
  - Devuelve las coincidencias duplicadas como texto, para que puedas leerlas inmediatamente.
    Cada fila es: [string_A, string_B, similarity]
    Usa cuando: quieras ver qué nombres coincidieron con qué nombres.
- index_pairs:
  - Lo mismo que string_pairs, pero devuelve posiciones en tu lista de entrada en lugar de las cadenas.
    Cada fila es: [index_A, index_B, similarity]
    Usa cuando: quieras unir resultados nuevamente a tus filas de origen de forma segura (bases de datos, hojas de cálculo, exportaciones de CRM).
- deduped_strings:
  - Devuelve una lista limpia con duplicados eliminados (mantiene un representante de cada grupo duplicado).
    Usa cuando: quieras una lista final para exportar/usar, sin preocuparte por el mapeo nuevamente.
- deduped_indices:
  - Misma idea que deduped_strings, pero devuelve los índices de los elementos mantenidos.
    Usa cuando: quieras mantener las filas originales (por índice) y eliminar los duplicados.
- membership_map:
  - Devuelve una lista de la misma longitud que tu entrada donde cada posición te indica el índice representativo para ese elemento.
    Ejemplo: [0,0,0,3,3] significa que las filas 0/1/2 son un grupo (rep=0) y las filas 3/4 son otro (rep=3).
    Usa cuando: desees índices de agrupación por fila.
- row_annotations:
  - Devuelve un objeto por cada fila de entrada con una explicación de a qué pertenece (fila rep + similitud).
    Usa cuando: quieras un resultado legible por humanos, por fila para depuración o visualización en UI.
top_k (opcional, entero o "todos", predeterminado "todos")

todos = encontrar todas las coincidencias por encima del umbral.

O un entero (por ejemplo, 50) para limitar las coincidencias por fila (más rápido, menos resultados).

Solicitud de ejemplo en python

import requests, json

API_KEY = "TU_CLAVE_ZYLA"
URL = "API_URL/dedupe"

data_list = ["Microsoft","Micsrosoft","Apple Inc","Apple","Google LLC","9oogle"]

params = {
"data": json.dumps(data_list),
"similarity_threshold": "0.75",
"remove_punctuation": "true",
"to_lowercase": "true",
"use_token_sort": "false",
"output_format": "string_pairs",
"top_k": "all"
}

headers = {"Authorization": f"Bearer {API_KEY}"}
r = requests.post(URL, headers=headers, params=params, timeout=60)
print(r.status_code)
print(r.json())

                                                                            
POST https://pr148-testing.zylalabs.com/api/11919/scalable+vector+similarity+api/22656/dedupe

Dedupe - Características del Endpoint

Objeto	Descripción
`data`	[Requerido] JSON array of strings to deduplicate (max 1000). Example: ["a","b","c"]
`similarity_threshold`	Opcional Similarity cutoff from 0 to 1. Higher values are stricter (fewer matches). Default is 0.75.
`remove_punctuation`	Opcional If true, punctuation is removed before matching. Default is true.
`to_lowercase`	Opcional If true, strings are lowercased before matching. Default is true.
`use_token_sort`	Opcional If true, tokens in each string are sorted before matching. Useful when word order varies. Default is false.
`output_format`	Opcional Default: string_pairs Allowed values (and what each means): index_pairs List of matches as [i, j, score] where i and j are indices in the input list. string_pairs List of matches as [string_i, string_j, score] using original strings. deduped_strings List of strings with duplicates removed (one representative per group). deduped_indices List of indices representing the deduplicated set (one representative per group). membership_map Array of length N where entry i is the representative index for the group of data[i]. row_annotations Array of objects (one per input row) with fields: index, original_string, rep_index, rep_string, similarity_to_rep.
`top_k`	Opcional Limits how many neighbors are returned per input string. Use all for full dedupe, or a positive integer for top matches per row.

Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"status":"success","response_data":[["Apple","appl!e",1.0]]}

Dedupe - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/11919/scalable+vector+similarity+api/22656/dedupe?data=["Apple", "appl!e"]' --header 'Authorization: Bearer YOUR_API_KEY'

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Similitud Vectorial Escalable API simplemente incluye tu token de portador en el encabezado de Autorización.

Encabezados

Encabezado	Descripción
`Autorización`	[Requerido] Debería ser `Bearer access_key`. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Preguntas

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento.

💫Basic

$24,99/Mes

50 Solicitudes / Mes
Luego $0,6497400 por solicitud si se supera el límite.
Límite de solicitudes: 60 reqs por minuto
Soporte al Cliente Especializado
Monitoreo de API en Tiempo Real
Transferencia de Datos Ilimitada Incluida

$24,99 / Mes

Sin compromiso. Cancela en cualquier momento

Popular

⚡Pro

$49,99/Mes

100 Solicitudes / Mes
Luego $0,6497400 por solicitud si se supera el límite.
Límite de solicitudes: 60 reqs por minuto
Soporte al Cliente Especializado
Monitoreo de API en Tiempo Real
Transferencia de Datos Ilimitada Incluida

$49,99 / Mes

Sin compromiso. Cancela en cualquier momento

🔥Pro Plus

$99,99/Mes

200 Solicitudes / Mes
Luego $0,6497400 por solicitud si se supera el límite.
Límite de solicitudes: 120 reqs por minuto
Soporte al Cliente Especializado
Monitoreo de API en Tiempo Real
Transferencia de Datos Ilimitada Incluida

$99,99 / Mes

Sin compromiso. Cancela en cualquier momento

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año

Volumen Personalizado
Límite de solicitudes personalizado
Soporte al Cliente Especializado
Monitoreo de API en Tiempo Real

Agendar una Llamada

Funciones favoritas de los clientes

✔︎ Paga Solo por Solicitudes Exitosas
✔︎ Prueba 7 días gratis
✔︎ Soporte Multilenguaje
✔︎ Una Clave API, Todas las APIs.
✔︎ Panel de Control Intuitivo

✔︎ Manejo de Errores Integral
✔︎ Documentación Amigable para Desarrolladores
✔︎ Integración con Postman
✔︎ Conexiones HTTPS Seguras
✔︎ Tiempo de Actividad Fiable

Similitud Vectorial Escalable API FAQs

¿Qué tipo de datos devuelve el endpoint Dedupe?

El endpoint Dedupe devuelve un objeto JSON que contiene pares de cadenas coincidentes, puntajes de similitud y resultados deduplicados opcionales La salida se puede formatear como pares de cadenas, pares de índices o cadenas deduplicadas, según la configuración especificada

¿Cuáles son los campos clave en los datos de respuesta?

Los campos clave en los datos de respuesta incluyen "estado" (que indica éxito o error) y "datos_de_respuesta" que contiene los resultados formateados de acuerdo con la solicitud del usuario como pares coincididos o cadenas desduplicadas

¿Cómo pueden los usuarios personalizar sus solicitudes de datos?

Los usuarios pueden personalizar las solicitudes ajustando los parámetros en el objeto "config" como "similarity_threshold" para la estrictitud de coincidencia "remove_punctuation" para el preprocesamiento y "output_format" para elegir la estructura de resultado deseada

¿Cómo está organizada la data de respuesta?

Los datos de respuesta están organizados como un array de resultados donde cada entrada corresponde a un partido o cadena deduplicada Dependiendo del formato de salida las entradas pueden incluir cadenas originales índices y puntuaciones de similitud facilitando la integración en flujos de trabajo

¿Cuáles son los casos de uso típicos para estos datos?

Los casos de uso típicos incluyen la desduplicación de listas de clientes la conciliación de registros contra una lista maestra la limpieza de datos de CRM y la resolución de entidades a través de diferentes fuentes de datos para garantizar la integridad y precisión de los datos

¿Cómo se mantiene la precisión de los datos?

La precisión de los datos se mantiene a través de avanzados algoritmos de coincidencia difusa que tienen en cuenta problemas comunes de datos como errores tipográficos y diferencias de mayúsculas y minúsculas La API está diseñada para manejar datos desordenados de manera efectiva asegurando resultados de coincidencia fiables

¿Cuáles son los valores de parámetro aceptados para el endpoint Dedupe?

Los valores de parámetro aceptados incluyen "similarity_threshold" (0 a 1) "remove_punctuation" (booleano) "to_lowercase" (booleano) "use_token_sort" (booleano) y "top_k" (entero o "todos") Estos parámetros permiten a los usuarios adaptar el proceso de coincidencia a sus necesidades específicas

¿Cómo manejar resultados parciales o vacíos?

Si el endpoint de Dedupe devuelve resultados parciales o vacíos, los usuarios deben revisar los datos de entrada por problemas de calidad, como duplicados excesivos o umbrales de similitud muy bajos. Ajustar el "similarity_threshold" o revisar la lista de entrada puede ayudar a mejorar los resultados

General FAQs

¿Qué es Zyla API Hub?

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

¿Qué monedas y métodos de pago están permitidos?

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]

Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

¿Por qué no puedo pagar con mi moneda local aunque la vea en la página de precios?

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Mi pago fue rechazado, ¿qué debo hacer?

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

¿Cómo se me cobrará mi suscripción al API?

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

¿Cómo se descuentan mis llamadas a la API de mi plan?

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

¿Cómo funciona su ciclo de facturación?

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

¿Cómo actualizo mi plan de suscripción actual con una API?

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

¿Cómo puedo ver el número restante de llamadas a la API que puedo hacer este mes?

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

¿Cómo puedo saber el número máximo de solicitudes a la API permitidas en mi plan?

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

¿Cómo sé cuándo se restablecerá mi límite de solicitudes?

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

¿Puedo cancelar en cualquier momento?

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

¿Cómo funciona la prueba gratuita de 7 días?

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

¿Qué pasa si me olvido de cancelar mi prueba gratuita?

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

¿Cuántas llamadas puedo hacer durante la prueba gratuita?

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

¿Cuándo se procesan las Órdenes de Pago?

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.

Si tengo algún problema, ¿con quién debo contactarme?

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Nivel de Servicio

100%

Tiempo de Respuesta

3.110ms

Categoría:

Procesamiento de Lenguaje Natural (PLN)

Etiquetas:

#Coincidencia difusa

La API de Similitud de Imágenes examina imágenes para identificar similitudes y diferencias a tr...

La API de seguimiento de productos de BestBuy ofrece acceso rápido y fluido a una amplia gama de...

Comercio y comercio electrónico Prueba 7 días gratis

Nivel de Servicio:

100%

Tiempo de Respuesta:

6.789ms

Similitud Vectorial Escalable API API ID: 11919

Descripción larga (equilibrada, amigable para el mercado)

¿Qué te gustaría ver? Mira la información o consulta la documentación?

Documentación de la API

Endpoints

RESPUESTA DE EJEMPLO DE LA API

Dedupe - CÓDIGOS DE EJEMPLO

Clave de Acceso a la API y Autenticación

Preguntas

Precios Simples y Transparentes

💫Basic

$24,99/Mes

⚡Pro

$49,99/Mes

🔥Pro Plus

$99,99/Mes

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en $ 10.000/Año

Funciones favoritas de los clientes

Similitud Vectorial Escalable API FAQs

¿Qué tipo de datos devuelve el endpoint Dedupe?

¿Cuáles son los campos clave en los datos de respuesta?

¿Cómo pueden los usuarios personalizar sus solicitudes de datos?

¿Cómo está organizada la data de respuesta?

¿Cuáles son los casos de uso típicos para estos datos?

¿Cómo se mantiene la precisión de los datos?

¿Cuáles son los valores de parámetro aceptados para el endpoint Dedupe?

¿Cómo manejar resultados parciales o vacíos?

General FAQs

¿Qué es Zyla API Hub?

¿Qué monedas y métodos de pago están permitidos?

¿Por qué no puedo pagar con mi moneda local aunque la vea en la página de precios?

Mi pago fue rechazado, ¿qué debo hacer?

¿Cómo se me cobrará mi suscripción al API?

¿Cómo se descuentan mis llamadas a la API de mi plan?

¿Cómo funciona su ciclo de facturación?

¿Cómo actualizo mi plan de suscripción actual con una API?

¿Cómo puedo ver el número restante de llamadas a la API que puedo hacer este mes?

¿Cómo puedo saber el número máximo de solicitudes a la API permitidas en mi plan?

¿Cómo sé cuándo se restablecerá mi límite de solicitudes?

¿Puedo cancelar en cualquier momento?

¿Cómo funciona la prueba gratuita de 7 días?

¿Qué pasa si me olvido de cancelar mi prueba gratuita?

¿Cuántas llamadas puedo hacer durante la prueba gratuita?

¿Cuándo se procesan las Órdenes de Pago?

Si tengo algún problema, ¿con quién debo contactarme?

Nivel de Servicio

Tiempo de Respuesta

Categoría:

Etiquetas:

APIs Relacionadas

Texto a Vector API

Texto a arreglo de vectores API

JPG a SVG API

Similitud de Imágenes Visuales API

Coincidencia de Imágenes Similares API

Aumentador de Imágenes API

Verificador de Similitud de Texto API

Error API

Similitud de texto API

Similitud de imagen API

También te puede interesar

BizBuySell Mercado API

BizBuySell Información API

Listados de BizBuySell API

Datos de Listados de BizBuySell API

Extractor de Datos de BizBuySell API

BizBuySell Scraper API

BizBuySell Búsqueda de Negocios API

Información del producto BestBuy API

Buscador de Productos de Best Buy API

Rastreador de Productos BestBuy API

Comienza en
$ 10.000/Año