ANÁLISIS DE RESULTADOS
TABLAS DE COSTES DE REPARTO Y RECOGIDA
3. Toma de muestras
Una vez identificadas todas las variables que afectan al funcionamiento de cada una de las zonas de reparto y recogida, el siguiente paso es la toma de muestras de cada una de estas variables. La toma de muestras es uno de las etapas más importantes y laboriosa en la creación y la elaboración de un modelo. Cualquier modelo será tan bueno como los datos en los que esté basado (Vincent, 1998).
_____________________________________________________________________________________ O. Rioja 61
Para la obtención de muestras existen dos tipos de estudios que se pueden llevar a cabo, el estudio observacional y un experimento diseñado.
En los estudios observacionales, una vez conocidas las variables que se desean medir, se obtienen las muestras a través de la observación del sistema sin perturbar ni interaccionar con el proceso. Si este estudio se planea con anterioridad y se realiza adecuadamente puede proporcionar datos exactos, completos y fiables. Por el contrario, este tipo de estudios proporcionan información muy limitada acerca de las relaciones entre los datos, y puede conducir a problemas de colinealidad (Ryan, 2007).
Por el contrario, en los experimentos diseñados se recolectan los datos de las variables que se desean estudiar mediante una estrategia bien definida, la cual consiste en una serie de experimentos, en los cuales se puede modificar los valores de cada factor o variable. El principal inconveniente que presenta este tipo de estudios es que en ocasiones puede resultar muy complejo y costoso el llevar a cabo una serie de experimentos diseñados (Montgomery et al, 2004).
A la hora de elegir entre un estudio u otro se debe alcanzar un compromiso entre la complejidad de obtener los datos y el potencial explicativo de los mismos (Kleinbaum et all, 1988). En este caso, se ha decidido llevar a cabo un estudio observacional ya que resulta de gran rapidez y sencillez el obtener todos los datos del sistema informático de la empresa de paquetería industrial. Otra ventaja que ofrece en este caso el estudio observacional es que conociendo de antemano las variables que se quieren medir, es posible el desarrollar una aplicación informática mediante la cual los datos pueden ser presentados en la forma más interesante para realizar el análisis de regresión.
Antes de explicar cómo se lleva a cabo la toma de muestras es interesante recordar que una zona de reparto/recogida puede estar compuesta por un único código postal, por varios códigos postales, o un código postal puede estar compartido por más de un chofer. Por lo tanto, para poder analizar adecuadamente cada una de estas cuatro variables identificadas en el apartado anterior es necesario realizar el estudio por código postal de estas variables, y posteriormente, determinar si cada uno de los códigos postales analizados puede conformar por si solo una zona de reparto/recogida, si es necesario el conjunto de más de un código postal para crear una zona de reparto, o por el contrario si es necesario el dividir un código postal entre varios conductores. De esta manera, al realizar este estudio por códigos postales se puede conocer los ingresos que un chofer tendría en el caso hipotético de que se le asignase ese código postal. De la misma manera, se podrá conocer la carga de trabajo en ese código postal, y la distancia y la extensión de ese código postal.
De las cuatro variables que se han identificado en el apartado anterior, tanto la distancia a la zona de reparto como la extensión de la misma, no se han considerado variables aleatorias, por lo que no es
Metodología__________________________________________________________________________
_____________________________________________________________________________________ O. Rioja 62
necesario tomar muestras de las mismas. Solamente será necesario realizar una tabla descriptiva con estas características. De las otras dos, sin embargo, sí que será necesario.
En el caso de estudio ya se analizó cómo se obtienen los costes de distribución en la red capilar de esta empresa de transporte de paquetería industrial. Por un lado, están los costes debidos a los repartos, y por otro, los costes asociados a las recogidas. Estos costes son independientes los unos de los otros. Tanto los costes de reparto como de recogida son análogos. Hay una parte fija por realizar un reparto, y otra variable en función del peso del reparto. Las cantidades de la parte fija como de la variable, no son las mismas para todos los repartos, están tabuladas en función del peso de los mismos. Cuanto mayor es el peso, mayor es la parte fija; mientras que a mayor peso, menor es la parte variable (ver tabla 1). Por lo tanto, se puede observar como los costes de reparto dependen del número de repartos y del peso de cada uno de esos repartos. Y en el caso de las recogidas, del número de recogidas y del peso de cada una de ellas. Como los costes de recogida y reparto son independientes, se realizará por cada código postal un análisis de regresión de los costes de reparto, y otro de los costes de recogida.
Debido a que los conductores trabajan en un régimen a producción, estos costes de distribución dependen de los días trabajados. Como los días laborales varían de un mes a otro, no es posible el crear un modelo que estime los costes mensuales de manera adecuada, por lo que se ha decidido realizar un modelo que estime los costes diarios. Estos costes dependen del número de repartos realizados por día y del peso total repartido por día. Este peso total repartido por día es la suma unitaria de los pesos de cada uno de los repartos. Siendo el caso de las recogidas análogo.
Por lo tanto, las variables costes diarios de reparto, peso total recogido por día, número de repartos por día, costes diarios de recogida, peso total recogido por día y número de recogidas por día se consideran como las variables más representativas para la toma de muestras y determinar así los costes de distribución.
Tras comprobar que no existen variaciones estacionales en ninguna de estas variables mediante pruebas de comparación de medias, el tamaño de la muestra seleccionado será de cuatro meses, lo que reportará 84 observaciones.
Una vez que se disponen de las 84 observaciones, el siguiente paso es evaluar la independencia de éstas e investigar si existe algún tipo de correlación entre ellas. Para realizar estas comprobaciones se han empleado dos técnicas heurísticas (Guasch et al, 2003):
_____________________________________________________________________________________ O. Rioja 63
- Gráficas de autocorrelación: Estas gráficas evalúan la independencia de las observaciones de una muestra calculando los valores de autocorrelación. Si se considera un retardo j, se calcula la correlación de todos los pares de observaciones Oi y Oi+j. Si la muestra tiene n pares, la
autocorrelación de retardo j se calcula empleando n-j pares de observaciones. Por lo tanto, i va desde 1 hasta n-j.
Los valores obtenidos para los retardos entre 1 y 10 son los que mayor información aportan, mientras que a partir del retardo 20 no aportan ninguna información. Los valores de autocorrelación se denominan coeficientes de autocorrelación, y se calculan mediante la ecuación 36.
=
( ) Ecuación (36)
Donde ( ) es la varianza muestral, y (Ecuación 37) es la función de autocovariancia
=∑ [ ( )] ( ) Ecuación (37)
Para considerar la muestra independiente, los valores de deben estar entre -1 y 1.
- Diagrama de dispersión: Los diagramas de dispersión es una gráfica de los pares ( , ), para todo i=1,2,…., n-1. Si las observaciones son independientes, los puntos estarán distribuidos aleatoriamente en la gráfica. Si por el contrario están correlacionados, los puntos se distribuirán siguiendo una línea, bien con pendiente positiva, o bien con pendiente negativa.
Para la toma de muestras de la carga de trabajo, hay que indicar que ésta se compone del número de repartos y recogidas, y del peso total repartido y recogido. Como las muestras de estas variables ya se tomaron para el caso de la variable costes de distribución, esas mismas muestras serán las que se empleen para el estudio de la variable carga de trabajo.
Como ya se ha expuesto, se dispone de 84 observaciones obtenidas del estudio observacional, y se ha comprobado la independencia de todas las observaciones de las muestras. Tras esta comprobación, estas 84 observaciones se han de separar en dos grupos. El primer grupo de observaciones se denominará muestra de calibración, y se empleará para realizar el análisis de regresión y crear el modelo. Mientras tanto, el segundo se denominará muestra de predicción, y servirá para comprobar la capacidad de predicción de los datos y la validez del modelo (Snee, 1977). La separación de estas dos muestras se realizará mediante asignación aleatoria. Se calcularán una serie de 84 números aleatorios o stream, que siga una distribución uniforme entre 0 y 1. A cada uno de los números aleatorios le corresponderá una
Metodología__________________________________________________________________________
_____________________________________________________________________________________ O. Rioja 64
observación. Si el número aleatorio es menor que 0.5, su observación correspondiente será incluida en la muestra de predicción. Si el número aleatorio es mayor o igual que 0.5, la observación será incluida en la muestra de calibración. Para este trabajo, la generación de los números aleatorios para la separación de las muestras se lleva a cabo mediante el software Minitab.