• No se han encontrado resultados

This system has been devised as a proof of concept to test the scope of the latest tech- nologies in the NLP field. However, the intention is to develop this solution further to obtain a much more powerful and complex product. For this purpose, the following lines of future development are proposed:

• As the first line of development, it would be good to work on the project’s scalability in the AWS cloud. For this, it is recommended to follow the best practices offered by the AWS documentation in each service. At the same time, the use of tools that allow the incorporation of CI/CD techniques such as cloudFormation to speed up the development and deployment process of the solution is proposed.

• On the other hand, the generalization of the system logic is proposed. During this development, two different architectures have been created based on the type of channel used by the user. It is now suggested to create a gateway that obtains inputs from any medium and processes them in the same way, regardless of the format in which it is found. This feature would reduce the number of elements in the system and standardize the system logic to a single structure.

• Closely related to the previous point is the integration of the system with different platforms, thanks to the numerous options offered by Dialogflow. Currently, the system is integrated with Twitter and Alexa, but it could be extended to a Telegram bot, an embedded web chatbot or even a phone call.

• In turn, Alexa offers a graphical interface to support your experience through visual effects. Therefore, exploring the scope of this experience would be interesting to give even more possibilities to the user.

• As for the Question Answering module, the creation of a dataset is proposed to finalize the model. This would allow the model to adapt much better to the use case. To this end, a new dataset would be created from the dataset created, with the format required for this new finetuning model.

• At the same time, it would be very interesting to attack the problem of cross- references between decrees/laws within the legal document. For example, a specific article often refers to another article to solve a given situation. This complex issue requires a thorough investigation of the possible options and how to address them.

One of the first solutions is to obtain these references when processing the legal text, saving them in a new column within the dataset called "references".

• As for the monitoring part of the system, the incorporation of new services offered by AWS is proposed to obtain data and analytics of the system performance. Among these new services is Kinesis Firehose, which allows the capture of real-time data streams for performance analysis or metrics creation. All this data would be stored in an S3 container for further data analysis.

• Finally, the option of applying this same system created for other areas of the city council, not only the urban planning area, is raised. All those areas with a hierarchy in their documentation similar to that presented in urban planning documents would be suitable to study this system’s applicability.

50

Appendix

Text bench for QA models

testset= [ "contexto":"1. Pertenecen a esta zona las áreas grafiadas en el Plano de Or- denación con el código 8. 2. Su tipología corresponde a edificación aislada o pareada, admitiéndose la tipología agrupada en hilera o adosada en vivienda unifamiliar, en las condiciones que al efecto se regulan. 3. Su uso cualificado es residencial en su categoría de vivienda unifamiliar.", "preguntas": ["¿Cuál es el uso cualificado de localización?","¿Cuál es la tipología de localización?"], "articulo": "Artículo 8.8.1 Ámbito y características (N- 1)" , "contexto":"Son admisibles las contempladas en los artículos 1.4.8, 1.4.9 y 1.4.10 de las presentes Normas Urbanísticas.", "preguntas": ["¿Cuáles son las obras admisibles en localización?"], "articulo": "Artículo 8.8.2 Obras admisibles (N-2)" , ’contexto’:’1. Se establecen los siguientes valores de superficie mínima de parcela para cada grado: a) Grado 1º: Dos mil quinientos (2.500) metros cuadrados. b) Grado 2º: Mil (1.000) met- ros cuadrados. c) Grado 3º: Doscientos cincuenta (250) metros cuadrados. d) Grado 4º: Doscientos cincuenta (250) metros cuadrados. e) Grado 5º: Ciento cincuenta (150) metros cuadrados. f) Grado 6º: Setecientos cincuenta (750) metros cuadrados. 2. No será de aplicación la superficie de parcela mínima, que se establece en este artículo, en aquellas que concurran las circunstancias siguientes: a) La parcela que a la entrada en vigor del Plan General, constara inscrita en el Registro de la Propiedad como una unidad predial independiente, respondiendo su deslinde a un acto de parcelación urbanística con aprobación municipal, y su extensión y forma permita desarrollar una vivienda con las condiciones establecidas para vivienda mínima en el art. 7.3.4, apartado 1, respetando las restantes condiciones particulares de su grado correspondiente. b) Parcelas intersti- ciales que no sean reparcelables, siempre que la parcela tenga una forma y superficie en la que se pueda construir una vivienda que cumpla con las condiciones establecidas para vivienda mínima en el art. 7.3.4, apartado 1, respetando las restantes condiciones partic- ulares de su grado correspondiente. c) En los ámbitos regulados por el grado 2º nivel "a", las parcelas que a la entrada en vigor del Plan General, constaran inscritas en el Reg- istro de la Propiedad como una unidad predial independiente, respondiendo su deslinde a un acto de parcelación urbanística con aprobación municipal, les serán de aplicación las condiciones de posición del grado 3º. 3. Las condiciones de parcela mínima no son de aplicación en las destinadas a usos dotacionales e infraestructurales.’, ’preguntas’: [’¿Cuál es la parcela mínima en localización?’], ’articulo’: ’Artículo 8.8.4 Parcela mínima (N-1)’ ,

"contexto":"1. No cabrá efectuar parcelaciones, reparcelaciones o segregaciones de fincas que incumplan, las superficies mínimas de parcela señaladas en el artículo anterior y las siguientes dimensiones mínimas en su lindero frontal: a) Grado 1º: Diez (10) metros lin- eales. b) Grado 2º: Diez (10) metros lineales. c) Grados 3º y 4º: Ocho (8) metros lineales

51

y cinco (5) metros lineales en tipología de vivienda agrupada en hilera o adosada.884 d) Grado 5º: Cinco (5) metros lineales. e) Grado 6º: Diez (10) metros lineales. 2. La forma de la parcela permitirá inscribir en la misma un círculo de diámetro igual o superior a:

a) Grado 1º: Treinta (30) metros. b) Grados 2º y 6º: Veinte (20) metros. c) Grado 3º:

Diez (10) metros. d) Grado 4º: Ocho (8) metros. e) Grado 5º: Cinco (5) metros. 3.

En parcelaciones de vivienda unifamiliar adosada, agrupada o en hilera en el grado 3º, la proporción entre el fondo de la parcela y su frente no excederá de cinco a uno (5:1).",

"preguntas": ["¿Qué condiciones debo cumplir para parcelar mi parcela de localización?"],

"articulo": "Artículo 8.8.5 Condiciones de parcelación (N-2)" , "contexto":"1. La sepa- ración de las fachadas a los linderos laterales será como mínimo: a) Grado 1º: Siete (7) metros. b) Grado 2º: Cinco (5) metros.885 c) Grado 3º: Tres (3) metros. d) Grado 4º:

Tres (3) metros. e) Grado 5º: Tres (3) metros. f) Grado 6º: La separación de la línea de edificación a los linderos laterales será igual o superior a la mitad de su altura (H/2) con un mínimo de tres (3) metros, tomando como valor de H la altura de cornisa corre- spondiente al lindero. 2. Respecto al lindero testero, la separación será igual o superior a 2H:3 con un mínimo de cuatro (4) metros. Siendo el valor de (H), la altura de cornisa de los citados cuerpos, salvo en el grado 6º, en el que se tomará como valor de (H) la mayor de las alturas de cornisa de la construcción. 3. En los grados 3º, 4º y 5º, la edificación podrá adosarse a uno de los linderos, y en grado 6º a uno de los linderos laterales o al testero, en las condiciones que determina el art. 6.3.13. 4. En los grados 3º, 4º y 5º, la construcción podrá adosarse a los linderos en solución de vivienda unifamiliar agrupada, en hilera o adosada, en las condiciones del art. 6.3.13, apartados 2 y 4, extendidas al conjunto de las parcelas afectadas. 5. En cualquier caso, el conjunto continuo de planos de fachadas, no superará una longitud máxima de cuarenta y ocho (48) metros lineales, pudiéndose superar esta dimensión a través de Estudio de Detalle, sin rebasar en ningún caso los sesenta y cuatro (64) metros lineales.886", "preguntas": ["¿Cuánto me tengo que separar a linderos laterales en localización?","¿Puedo adosarme a linderos laterales en lo- calización?"], "articulo": "Artículo 8.8.6 Separación a linderos (N-2)" , "contexto":"1. La separación entre el plano de la fachada y la alineación oficial será superior a los siguientes valores: a) Grado 1º: Diez (10) metros. b) Grado 2º: Siete (7) metros. c) Grado 3º:

Cuatro (4) metros. d) Grado 4º: Cuatro (4) metros. e) Grado 5º: Cinco (5) metros. f) Grado 6º: Cuatro (4) metros. 2. En los grados 1º y 2º El espacio correspondiente al retranqueo no podrá ocuparse con ningún tipo de construcción, sobre rasante, salvo las instalaciones reguladas en el art. 6.10.20. 3. En los grados 3º, 4º, 5º y 6º Se autoriza la construcción de un cuerpo de edificación, que podrá situarse en la alineación oficial y adosado a uno de los linderos laterales para lo que requerirá autorización del propietario colindante en las condiciones señaladas en el epígrafe ", "preguntas":["¿Cuánto se tiene que retranquear mi edificio en localización?","¿Puedo construir en el espacio de retran- queo en localización?"], "articulo":"Artículo 8.8.7 Retranqueos (N-2)" , "contexto":"1. 1.

La ocupación de la parcela por el conjunto de edificaciones situadas sobre y bajo rasante, no podrá ser superior al resultado de aplicar a la superficie de parcela edificable los sigu- ientes coeficientes de ocupación: a) Grado 1º: Veinte por ciento (20"preguntas": ["¿Qué porcentaje puedo ocupar de la parcela de localización?"], "articulo":"Artículo 8.8.8 Ocu- pación (N-2)" , "contexto":"1. El coeficiente de edificabilidad neta sobre parcela edificable se establece para cada grado y nivel en: a) Grado 1º: Tres (3) metros cuadrados por cada diez (10) metros cuadrados. b) Grado 2º: Cinco (5) metros cuadrados por cada diez (10) metros cuadrados. c) Grado 3º: Siete (7) metros cuadrados por cada diez (10) metros cuadrados. d) Grado 4º: Un (1) metro cuadrado por cada metro cuadrado. e) Grado 5º: Ocho (8) metros cuadrados por cada diez (10) metros cuadrados. f) Grado 6º: Para

52

parcelas de superficie menor o igual a quinientos (500) metros, siete (7) metros cuadrados por cada diez (10) metros cuadrados. Para parcelas de superficie mayor de quinientos (500) metros cuadrados, siete (7) metros cuadrados por cada diez (10) metros cuadra- dos sobre los primeros quinientos (500) metros cuadrados de superficie, y de cinco (5) metros cuadrados por cada diez (10) metros cuadrados sobre la superficie que exceda de quinientos (500) metros cuadrados.", "preguntas": ["¿Qué edificabilidad tiene la parcela de localización?"], "articulo": "Artículo 8.8.9 Coeficiente de edificabilidad (N-1)" , "con- texto":"La cota de origen y referencia para la medición de la altura de cornisa será la del contacto de edificación con el terreno en el punto medio de la fachada en que se sitúa el acceso al edificio. 1. En los grados 1º, 2º, 3º, 4º y 6º, la edificación no podrá superar una altura de tres (3) plantas, ni una altura de cornisa de mil cincuenta (1.050) centímetros.

2. En el grado 5º, la altura de la edificación no podrá exceder de dos (2) plantas ni de siete (7) metros a cornisa, medidos desde la cota de origen y referencia de la planta baja; dicha cota de origen y referencia no podrá situarse a más de ciento cincuenta (150) centímetros sobre la rasante de la acera en el punto medio del frente de parcela. 3. Sobre la última planta en los grados 1º, 2º, 3º, 4º y 6º, se admite la construcción de una planta, con una superficie máxima inferior o igual al diez por ciento (10"preguntas": ["¿Cuál es la altura de cornisa de localización?"], "articulo":"Artículo 8.8.10 Altura de cornisa (N-2)" , "con- texto":"1. En grado 1º niveles a y b: a) USO ASOCIADO. Los usos asociados se someten a las disposiciones para ellos reguladas en las condiciones generales de los usos compatibles del Capítulo 7.2. b) USO ALTERNATIVO. i) Terciario: hospedaje en edificio exclusivo cuando se trate:891 1. De actuación en manzana completa, con retranqueos iguales o superiores a 15 metros. 2. En parcelas con frente al sistema general viario con acceso resuelto desde el mismo, con superficie mínima de parcela de 5.000 metros cuadrados y con retranqueos, separación a linderos laterales y a lindero testero de 15 metros, 10 metros y H, con un mínimo de 6 metros, respectivamente. ii) Dotacional. En edificio exclusivo.

2. En el grado 1º nivel c: a) USO ASOCIADO. Los usos asociados se someten a las disposiciones para ellos reguladas en las condiciones generales de los usos compatibles del Capítulo 7.2. b) USO ALTERNATIVO. Con las siguientes condiciones: • Edificabilidad máxima de un (1) m²/m² de parcela edificable. • Ocupación: sobre rasante inferior o igual al cuarenta por ciento (40"preguntas": ["¿Cuáles son los usos compatibles de local- ización?"], "articulo": "Artículo 8.8.17 Usos compatibles (N-2)" , "contexto":"1. En el grado 1º niveles a y b):901 a) Terciario: hospedaje en edificio exclusivo, con retranqueos, separación a linderos laterales y a lindero testero de 15 metros, 10 metros y H, con un mínimo de 6 metros, respectivamente. Otros servicios terciarios: En edificio exclusivo. 2.

En el grado 2º niveles a y b: a) Terciario. Hospedaje en edificio exclusivo.902 Recreativo en la categoría ii) y otros servicios terciarios. En edificio exclusivo. 3. En el grado 2º nivel c: a) Terciario. Oficinas y hospedaje en edificio exclusivo. Comercial, en edificio exclusivo, excepto grandes superficies comerciales. Recreativo en la categoría ii) y otros servicios terciarios, en edificio exclusivo. 4. En el grado 3º niveles a y c:903 a) Terciario.

Hospedaje, en edificio de uso exclusivo, en tipología de edificación aislada. Recreativo, en edificio exclusivo, en tipología de edificación aislada. Otros servicios terciarios, en edificio exclusivo, en tipología de edificación aislada. 5. En el grado 4º. a) Terciario. Hospedaje, en edificio exclusivo. Comercial en categoría de pequeño y mediano comercio en tipología de edificación aislada en edificio exclusivo. Oficinas, en edificio exclusivo. Recreativo, en categoría ii), en edificio exclusivo, en tipología de edificación aislada. Otros servicios ter- ciarios, en edificio exclusivo, en tipología de edificación aislada. Estos usos autorizables, salvo el hospedaje en edificio exclusivo, no son de aplicación a las parcelas reguladas por la Norma Zonal 8-4.º con frente a las calles o incluidas en los límites que se relacionan

53

a continuación:904 905 C/ Guadalquivir, C/ Serrano, límite Sur APE 05.19 límite Este APE 05.17. C/ Fray Juan Gil, C/ del Darro, C/ Alfonso Rodríguez Santamaría, C/ del Segre, C/ del Tormes, C/ del Leire, límite APE 05.19, C/ Luis Muriel, límite APE 05.17 y C/ Francisco Méndez Casariego. C/ Mateo Inurria, C/ de Hiedra, C/ del Poniente y límite APE 05.24. C/ Mateo Inurria, C/ General López Pozas, C/ Francisco Suárez y nueva calle prevista en APE 05.05 entre Mateo Inurria y Francisco Suárez. Avenida del Comandante Franco, Avenida de Pío XII, C/ Madreselva, C/ de la Madre de Dios, calle nueva apertura hasta APE 05.22, límite APE 05.22 y C/ Santa María Magdalena.

Avenida de Alfonso XIII, C/ Torpedero Tucumán y límite Este APE 05.22. C/ Pedro Valdivia. 6. En el grado 5º: a) Industrial: En edificio exclusivo. b) Terciario: Hospedaje en edificio exclusivo, en tipología de edificación aislada.906 Otros servicios terciarios: En edificio exclusivo. 7. En el grado 6º: a) Terciario: Hospedaje, otros servicios terciarios y comerciales, en edificio exclusivo, excepto grandes superficies comerciales.", "pregun- tas": ["¿Cuáles son los usos autorizables de localización?","¿Puedo destinar localización a industrial o terciario o dotacional?"], "articulo": "Artículo 8.8.18 Usos autorizables (N-2)"

]

54

Annex A: Social, environmental and ethical impacts and considerations

Over the last few years, we have seen more and more systems that, like the one developed in this project, are based on artificial intelligence to solve operational and repetitive tasks much more efficiently and faster. This brings with it significant advantages but also some drawbacks that, if not addressed in time, can negatively impact society. Among the benefits we can highlight, one of the main ones is the availability of a fast, economical and accessible public information system. Fast because the query can be made from any Alexa device or any Twitter account in a matter of minutes, compared to the few days it could take to process a traditional query, economic because all channels of communication with the system are free and it requires a Twitter account or an Alexa device to use it (or the Alexa app for computers or mobile phones in its absence) and accessible because it can interact through voice, making possible the interaction with visually impaired people or elderly people with little technological knowledge.

In turn, this technology has the ability to be implemented in other areas within the public sector, streamlining all kinds of consultation procedures that can be performed, not only to the citizens themselves but to public administrators. Moreover, being supported in the cloud, it is an easily scalable system for a large population, giving the possibility of being used by the population of an entire city such as Madrid.

As for its environmental impact, it can be commented that its energy footprint is the one generated by AWS cloud services. These services have a high commitment to energy efficiency, to such an extent that its goal for 2025 is that all its data centers are supplied 100% by renewable energy sources.

However, despite the many benefits of these types of systems, one point generates a lot of controversies when scaling these products. It has been proven that AI-based systems can perform operational tasks much faster and more efficiently than humans.

This makes any task in this field susceptible to be completed by an AI system, which could generate a massive wave of unemployment. During all industrial revolutions, technological breakthroughs have caused unemployment and precariousness in all sectors where workers have been affected. However, this new era has the potential to encompass almost every known field and to impact all sectors, both public and private. Therefore, it must be kept in mind that the transition to this time must be controlled, despite the possibility of scaling the systems up to millions of users, to allow the labour market to adapt to this transition and obtain new skills to coexist with these systems. For example, AI systems engineers, dataset creators or AI systems testers could be jobs that will originate in the following decades, and today’s workers can obtain that. All that is needed is a contingency plan and

55

relevant training that keeps in mind the objective of relocating workers to new positions and is willing to accompany them throughout this further training as AI professionals.

56

Annex B: Economic budget

The following is a detailed economic breakdown of this project, from the cost of personnel to the cost of equipment and maintenance:

57

58

Bibliography

[1] P. J. Rusell, Stuart; Norvig, Artificial Intelligence: A Modern Approach. Prentice Hall, 2021. 5

[2] J. McCarthy, “What is artificial intelligence?,” 2007. 5

[3] I. El Naqa and M. J. Murphy,What Is Machine Learning?, pp. 3–11. Cham: Springer International Publishing, 2015. 5

[4] K. R. Chowdhary, Natural Language Processing, pp. 603–649. New Delhi: Springer India, 2020. 5

[5] P. M. Nadkarni, L. Ohno-Machado, and W. W. Chapman, “Natural language pro- cessing: an introduction,” Journal of the American Medical Informatics Association, vol. 18, pp. 544–551, 09 2011. 5

[6] A. Singhal et al., “Modern information retrieval: A brief overview,” IEEE Data Eng.

Bull., vol. 24, no. 4, pp. 35–43, 2001. 6

[7] L. Hirschman and R. Gaizauskas, “Natural language question answering: the view from here,” Natural Language Engineering, vol. 7, no. 4, p. 275–300, 2001. 6

[8] S. M. Harabagiu, S. J. Maiorano, and M. A. Pasca, “Open-domain textual question answering techniques,” Natural Language Engineering, vol. 9, no. 3, p. 231–267, 2003.

6

[9] T. Mikolov, I. Sutskever, K. Chen, G. Corrado, and J. Dean, “Distributed represen- tations of words and phrases and their compositionality,” 2013. 6

[10] A. Aizawa, “An information-theoretic perspective of tf–idf measures,” Information Processing & Management, vol. 39, no. 1, pp. 45–65, 2003. 6

[11] Wikipedia contributors, “One-hot — Wikipedia, the free encyclopedia,” 2022. [Online;

accessed 06-June-2022]. 6

[12] T. Mikolov, K. Chen, G. Corrado, and J. Dean, “Efficient estimation of word repre- sentations in vector space,” 2013. 7

[13] P. Rajpurkar, J. Zhang, K. Lopyrev, and P. Liang, “Squad: 100,000+ questions for machine comprehension of text,” 2016. 7, 27

[14] C. P. Carrino, M. R. Costa-jussà, and J. A. R. Fonollosa, “Automatic spanish trans- lation of the squad dataset for multilingual question answering,” 2019. 7, 26

[15] E. team, “spacy: Industrial-strength nlp,” 2022. [Online; accessed 23-May-2022]. 8

59

[16] E. team, “spacy: Industrial-strength nlp. training pipelines & models,” 2022. [Online;

accessed 23-May-2022]. 8

[17] W. S. McCulloch, “A logical calculus of the ideas immanent in nervous activity,” The bulletin of mathematical biophysics, vol. 5, pp. 115–133, 1943. 9

[18] M. Schuster and K. Paliwal, “Bidirectional recurrent neural networks,” IEEE Trans- actions on Signal Processing, vol. 45, no. 11, pp. 2673–2681, 1997. 9

[19] S. Hochreiter and J. Schmidhuber, “Long short-term memory,” Neural computation, vol. 9, pp. 1735–80, 12 1997. 9

[20] Wikipedia contributors, “Vanishing gradient problem — Wikipedia, the free encyclo- pedia,” 2022. [Online; accessed 12-June-2022]. 9

[21] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser, and I. Polosukhin, “Attention is all you need,” 2017. 9

[22] T. Wolf, L. Debut, V. Sanh, J. Chaumond, C. Delangue, A. Moi, P. Cistac, T. Rault, R. Louf, M. Funtowicz, J. Davison, S. Shleifer, P. von Platen, C. Ma, Y. Jernite, J. Plu, C. Xu, T. Le Scao, S. Gugger, M. Drame, Q. Lhoest, and A. Rush, “Trans- formers: State-of-the-art natural language processing,” in Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demon- strations, (Online), pp. 38–45, Association for Computational Linguistics, Oct. 2020.

9

[23] M. Rodríguez-Cantelar, D. de la Cal, M. Estecha, A. G. Gutierrez, D. Martin, R. Martínez, N. Rodríguez, and L. F. D’Haro, “Genuine2: An open domain chat- bot based on generative models,” 2020. 9

[24] J. Cebrián, R. Martínez, N. Rodríguez, and L. F. D’Haro, “Considerations on creating conversational agents for multiple environments and users,” AI Magazine, vol. 42, pp. 71–86, 2021. 9

[25] A. Gutiérrez-Fandiño, J. Armengol-Estapé, M. Pàmies, J. Llop-Palao, J. Silveira- Ocampo, C. P. Carrino, C. Armentano-Oller, C. Rodriguez-Penagos, A. Gonzalez- Agirre, and M. Villegas, “Maria: Spanish language models,” Procesamiento del Lenguaje Natural, vol. 68, no. 0, pp. 39–60, 2022. 9

[26] T. P. S. Foundation, “Python: Official site.” https://www.python.org/, 2022. [On- line; accessed 24-January-2022]. 11

[27] S. Inc., “Streamlit: Official site.” https://streamlit.io/, 2022. [Online; accessed 24-January-2022]. 12, 42

[28] T. P. team, “Pandas: Official site.” https://pandas.pydata.org/, 2022. [Online;

accessed 24-January-2022]. 12, 17

[29] T. M. D. team, “Matplotlib: Visualization with python.”https://matplotlib.org/, 2021. [Online; accessed 16-June-2022]. 12

[30] T. H. team, “Huggingface: The ai community building the future.” https://

huggingface.co/, 2022. [Online; accessed 25-May-2022]. 12,15, 26

[31] A. W. Services, “Amazon textract: Automatically extract printed text, handwriting, and data from any document.” https://aws.amazon.com/textract/, 2022. [Online;

accessed 25-May-2022]. 13

60

Documento similar