Estamos construyendo nuestro propio lenguaje de consulta similar a Mysql usando antlr4. Excepto que solo usamos where clause
, en otras palabras, el usuario no ingresa select/from
declaraciones.
Pude crear gramática para ello y generar lexers / parsers / listeners en golang.
Debajo de nuestro archivo de gramática EsDslQuery.g4:
grammar EsDslQuery;
options {
language = Go;
}
query
: leftBracket = '(' query rightBracket = ')' #bracketExp
| leftQuery=query op=OR rightQuery=query #orLogicalExp
| leftQuery=query op=AND rightQuery=query #andLogicalExp
| propertyName=attrPath op=COMPARISON_OPERATOR propertyValue=attrValue #compareExp
;
attrPath
: ATTRNAME ('.' attrPath)?
;
fragment ATTR_NAME_CHAR
: '-' | '_' | ':' | DIGIT | ALPHA
;
fragment DIGIT
: ('0'..'9')
;
fragment ALPHA
: ( 'A'..'Z' | 'a'..'z' )
;
attrValue
: BOOLEAN #boolean
| NULL #null
| STRING #string
| DOUBLE #double
| '-'? INT EXP? #long
;
...
Ejemplo de consulta: color="red" and price=20000 or model="hyundai" and (seats=4 or year=2001)
ElasticSearch admite consultas sql con el complemento aquí: https://github.com/elastic/elasticsearch/tree/master/x-pack/plugin/sql .
Tener dificultades para entender el código Java.
Como tenemos operadores lógicos, no estoy muy seguro de cómo obtener el árbol de análisis y convertirlo a la consulta ES. ¿Alguien puede ayudar / sugerir ideas?
Actualización 1: se agregaron más ejemplos con la consulta ES correspondiente
Consulta Ejemplo 1: color="red" AND price=2000
Consulta ES 1:
{
"query": {
"bool": {
"must": [
{
"terms": {
"color": [
"red"
]
}
},
{
"terms": {
"price": [
2000
]
}
}
]
}
},
"size": 100
}
Consulta Ejemplo 2: color="red" AND price=2000 AND (model="hyundai" OR model="bmw")
Consulta ES 2:
{
"query": {
"bool": {
"must": [
{
"bool": {
"must": {
"terms": {
"color": ["red"]
}
}
}
},
{
"bool": {
"must": {
"terms": {
"price": [2000]
}
}
}
},
{
"bool": {
"should": [
{
"term": {
"model": "hyundai"
}
},
{
"term": {
"region": "bmw"
}
}
]
}
}
]
}
},
"size": 100
}
Consulta Ejemplo 3: color="red" OR color="blue"
ES consulta 3:
{
"query": {
"bool": {
"should": [
{
"bool": {
"must": {
"terms": {
"color": ["red"]
}
}
}
},
{
"bool": {
"must": {
"terms": {
"color": ["blue"]
}
}
}
}
]
}
},
"size": 100
}
color="red" and price=20000 or model="hyundai" and (seats=4 or year=2001
ve en la sintaxis de ES? ¿Desea la sintaxis JSON, o la sintaxis de cadena de consulta corta, o algo completamente diferente? También ayuda si agrega más de 1 ejemplo. Además, ¿ya has probado algo tú mismo?Respuestas:
URL de demostración de trabajo: https://github.com/omurbekjk/convert-dsl-to-es-query-with-antlr , tiempo estimado invertido: ~ 3 semanas
Después de investigar antlr4 y varios ejemplos, encontré una solución simple con listener y stack. Similar a cómo se calculan las expresiones usando stack.
Necesitamos sobrescribir al oyente base predeterminado con el nuestro para obtener disparadores para cada regla gramatical de entrada / salida. Las reglas importantes son:
Debajo de mi código de escucha personalizado escrito en golang:
Y archivo principal:
fuente
¿Has pensado en convertir tus declaraciones tipo sql para consultas de cadena de consulta ?
Si sus casos de uso siguen siendo simples
color="red" and price=20000 or model="hyundai" and (seats=4 or year=2001)
, iría con lo anterior. La sintaxis es bastante potente, pero se garantiza que las consultas se ejecutarán más lentamente que las consultas DSL nativas y detalladas, ya que el analizador ES necesitará convertirlas a DSL por usted.fuente
GET index_name/_mapping
que desee obtener su mapeo primero ( ), identificar qué campos querrá exponer a los usuarios para que busquen (para que pueda construir su validador o una funcionalidad "did-you-mean"). Si desea aplicar los tipos de datos de valor de campo, también puede extraer esa información de la asignación ...Hay un software llamado Dremio https://www.dremio.com/
Puede traducir la consulta SQL a una consulta de búsqueda elástica
https://www.dremio.com/tutorials/unlocking-sql-on-elasticsearch/
fuente