Smarthand


En el impulso por desarrollar sistemas robóticos que puedan sentir e interactuar con su entorno, se han realizado enormes inversiones en visión artificial. Hemos visto los frutos de estas inversiones en una amplia gama de aplicaciones, desde automóviles autónomos hasta la automatización de robots industriales. Si bien estos esfuerzos han tenido mucho éxito, los sensores ópticos no son la solución ideal para todos los casos de uso. Las tareas de manipulación de objetos, por ejemplo, suelen requerir información táctil para manipular con precisión y seguridad los objetos de interés. Puede imaginar un enfoque híbrido en el que los métodos de visión por computadora localicen el objeto y dirijan un robot a la posición correcta. A partir de ahí, los sensores táctiles dentro de una mano robótica brindan información sobre la fragilidad o robustez del objeto y ayudan a crear un plan para llevar a cabo las intenciones del robot.

En comparación con la visión por computadora, se ha dedicado mucha menos atención al desarrollo de sensores táctiles, lo que los hace generalmente menos sofisticados que sus contrapartes ópticas. Esto ha dificultado el desarrollo de robots que sean capaces de generar una comprensión de alta resolución de su entorno mediante la integración de datos de múltiples tipos de sensores.

 En un esfuerzo por comenzar a abordar las deficiencias en la tecnología de detección táctil actual, un equipo de ingenieros de ETH Zürich ha desarrollado un dispositivo que llaman SmartHand .

 SmartHand es un sistema integrado de hardware y software creado para recopilar y procesar información táctil de alta resolución de una matriz de sensores múltiples en forma de mano en tiempo real.

System architecture (📷: X. Wang et al.)

Arquitectura del sistema (📷: X. Wang et al.)

El dispositivo SmartHand utiliza una rejilla sensora táctil resistiva de bajo costo, basada en un compuesto de polímero conductor, que se pega a un guante. Se adjunta una unidad de medición inercial (IMU) en la parte posterior del guante para proporcionar información adicional sobre el movimiento. Los datos de los 1024 sensores táctiles (dispuestos en una cuadrícula de 32 por 32) y la IMU se introducen en una placa de descubrimiento STM32F769NI conectada a la muñeca a través de una serie de cables. Esta placa contiene un núcleo Arm Cortex-M7 que funciona a 216 MHz, con 2 MB de memoria flash y 532 kB de RAM.

Para demostrar SmartHand, los investigadores querían poder detectar qué tipo de objeto sostenía la mano. Para ello, se creó y entrenó una red neuronal convolucional, basada en la arquitectura ResNet-18, para reconocer la relación entre los datos de los sensores y un conjunto de dieciséis objetos cotidianos. Se creó un conjunto de datos usando el dispositivo físico para que sirviera como datos de entrenamiento para el modelo. Recopilando mediciones a 100 cuadros por segundo (13,7 veces más rápido que el trabajo anterior), se generó un conjunto de datos táctiles que consta de 340.000 cuadros.

The sensor grid (📷: X. Wang et al.)

La red de sensores (📷: X. Wang et al.)

Al validar la red neuronal, se encontró que el modelo requiere un orden de magnitud menos de memoria y 15,6 veces menos cálculos, en comparación con los dispositivos actuales. Esto se logró manteniendo la red neuronal lo más compacta posible, sin sacrificar la precisión de las predicciones. Hablando de predicciones, se encontró que la precisión de clasificación top 1 del modelo alcanzó el 98,86% en el reconocimiento de objetos. Al mantener el procesamiento en el límite, el tiempo de inferencia se mantuvo en unos muy razonables 100 milisegundos.

Se observó que, debido a las propiedades inherentes de los materiales que componen la rejilla del sensor táctil, habrá cierto nivel de degradación con el uso repetido. Los primeros indicios sugieren que la degradación puede estabilizarse, lo que permitiría recalibrar el diseño actual después de un período de rodaje inicial sin ningún otro cambio. Actualmente están evaluando si este es el caso, o si la degradación del sensor continúa más allá de la meseta aparente, lo que requeriría más cambios de diseño antes de que sea posible el uso del dispositivo en el mundo real.

El equipo prevé que las técnicas de SmartHand se utilicen en futuras aplicaciones robóticas y protésicas de manos. Con un poco más de esfuerzo, este trabajo puede acercarnos a un mundo en el que los robots no parecen tan robóticos.

Fuente hackester.io

¿Que significa MLE?


Las siglas MLE corresponden al algoritmo de estimación de máxima verosimilitud y se usa por ejemplo para la desagregación de energía.

Es responsable cuando se desea un solo aparato desagregado en lugar de desagregar muchos. Además, el aparato debe ser mayoritariamente resistivo para lograr precisión.

Se basa en eventos emparejados:

- OnPower: valor delta cuando el aparato está encendido. 
- OffPOwer: valor delta cuando el aparato está apagado. 
- Duración: duración entre encendido y apagado.

Además, para descartar muchos eventos poco probables, se establecen tres restricciones:

- PowerNoise: valor delta mínimo por debajo del cual el delta se considera ruido. 
- PowerPair: diferencia máxima entre OnPower y OffPower (considerando electrodomésticos con consumo de energía constante).
 - timeWindow: marco de tiempo máximo entre Onpower y Offpower.

Las características antes mencionadas se modelan con gaussianas, mezclas gaussianas o Poisson. Para cada evento emparejado entrante, el algoritmo extraerá estas tres características y evaluará la probabilidad de máxima verosimilitud de que ese evento emparejado sea un dispositivo determinado.

IMPORTACIONES

import numpy as np
import pandas as pd
from os.path import join
from pylab import rcParams
import matplotlib.pyplot as plt
%matplotlib inline
rcParams['figure.figsize'] = (13, 6)
#plt.style.use('ggplot')
from datetime import datetime as datetime2
from datetime import timedelta

import nilmtk
from nilmtk.disaggregate.maximum_likelihood_estimation import MLE
from nilmtk import DataSet, TimeFrame, MeterGroup, HDFDataStore
from scipy.stats import poisson, norm
from sklearn import mixture
import warnings
warnings.filterwarnings("ignore")

Funciones

def get_all_appliances(appliance):

    # Filtering by appliances: 
    print "Fetching " + appliance + " over data loaded to nilmtk."
    metergroup = nilmtk.global_meter_group.select_using_appliances(type=appliance)
    
    if len(metergroup.appliances) == 0: 
        print "None " + appliance + " found on memory."
        pass

    # Selecting only single meters: 
    print "Filtering to get one meter for each " + appliance

    meters = [meter for meter in metergroup.meters if (len(meter.appliances) == 1)]
    metergroup = MeterGroup(meters)
    print metergroup
    print "Found " + str(len(metergroup.meters)) + " " + appliance

    return metergroup


def get_all_trainings(appliance, train):

    # Filtering by appliances: 
    print "Fetching " + appliance + " over data train data."
    elecs = []
    for building in train.buildings: 
        print "Building " + str(building) + "..."
        elec = train.buildings[building].elec[appliance]
        if len(elec.appliances) == 1: 
            print elec
            print "Fetched elec."
            elecs.append(elec)

        else: 
            print elec
            print "Groundtruth does not exist. Many appliances or None"

    metergroup = MeterGroup(elecs)

    return metergroup

Cargando datos

path = '../../../nilmtk/data/ukdale'
ukdale = train = DataSet(join(path, 'ukdale.h5'))

Y dividir en datos de prueba y de entrenaminento

In [8]:train = DataSet(join(path, 'ukdale.h5'))
test = DataSet(join(path, 'ukdale.h5'))
train.set_window(end="17-5-2013")
test.set_window(start="17-5-2013")
#zoom.set_window(start="17-5-2013")
print('loaded ' + str(len(ukdale.buildings)) + ' buildings')

loaded 5 buildings

Obteniendo los datos de entrenamiento

Es posible que el dispositivo seleccionado no esté entrenado desde ElecMeters donde se presentan otros dispositivos, ya que podemos extraer la verdad básica

# Appliance to disaggregate: 
applianceName = 'kettle'
# Groundtruth from the training data: 
metergroup = get_all_trainings(applianceName,train)

Fetching kettle over data train data.
Building 1...
ElecMeter(instance=10, building=1, dataset='UK-DALE', appliances=[Appliance(type='kettle', instance=1), Appliance(type='food processor', instance=1), Appliance(type='toasted sandwich maker', instance=1)])
Groundtruth does not exist. Many appliances or None
Building 2...
ElecMeter(instance=8, building=2, dataset='UK-DALE', appliances=[Appliance(type='kettle', instance=1)])
Fetched elec.
Building 3...
ElecMeter(instance=2, building=3, dataset='UK-DALE', appliances=[Appliance(type='kettle', instance=1)])
Fetched elec.
Building 4...
ElecMeter(instance=3, building=4, dataset='UK-DALE', appliances=[Appliance(type='kettle', instance=1), Appliance(type='radio', instance=1)])
Groundtruth does not exist. Many appliances or None
Building 5...
ElecMeter(instance=18, building=5, dataset='UK-DALE', appliances=[Appliance(type='kettle', instance=1)])
Fetched elec.

Algoritmo MLE

Capacitación

Primero, creamos el modelo

mle = MLE()

Luego, actualizamos el parámetro del modelo con algunos valores de adivinación.

Primero adivine las características: mezclas gaussianas de encendido y apagado y poisson de duración.

# setting parameters in the model: 
mle.update(appliance=applianceName, resistive=True, units=('power','active'), thDelta= 1500, thLikelihood= 1e-10, powerNoise= 50, powerPair= 100, timeWindow= 400, sample_period= '10S', sampling_method='first')

# Settings the features parameters by guessing:  
mle.onpower = {'name':'gmm', 'model': mixture.GMM(n_components=2)}
mle.offpower = {'name':'gmm', 'model': mixture.GMM(n_components=2)}
mle.duration = {'name':'poisson', 'model': poisson(0)}

Updating model
{'resistive': True, 'appliance': 'kettle', 'sampling_method': 'first', 'sample_period': '10S', 'thLikelihood': 1e-10, 'timeWindow': 400, 'units': ('power', 'active'), 'thDelta': 1500, 'powerNoise': 50, 'powerPair': 100}

Entrenando el modelo

Entrenamos el modelo con todas las ocurrencias de ese modelo de dispositivo que se encuentran en los datos de entrenamiento.

mle.train(metergroup)

('kettle', 1)
Training on chunk
Samples of onpower: 214
Samples of offpower: 214
Samples of duration: 214
Training onpower
Training offpower
Training duration
('kettle', 2)
Training on chunk
Samples of onpower: 92
Samples of offpower: 92
Samples of duration: 92
Training onpower
Training offpower
Training duration
('kettle', 3)
Chunk empty

Y luego visualizamos características con featureHist_colors () para ver la distribución y cuántas muestras tenemos para cada dispositivo (el mismo modelo de diferentes casas).

mle.featuresHist_colors()

A veces, tenemos más eventos de algunas casas que de otras, como vemos en la figura de arriba. Por lo tanto, necesitamos recortar información para mantener el mismo número de muestras para cada casa.

mle.no_overfitting()

Retraining onpower
Retraining offpower
Retraining duration

In [15]:mle.featuresHist_colors()

Hay otra herramienta de visualización para ver cómo se ajustan las distribuciones del modelo a los datos:

mle.featuresHist()

Onpower y Offpower parecen encajar bien con los datos, pero necesitamos cambiar el modelo por duración

mle.duration = {'name':'gmm', 'model': mixture.GMM(n_components=10)}

Y luego volvemos a entrenar el modelo y usamos no_overfitting

mle.train(metergroup)
mle.no_overfitting()
mle.featuresHist()

('kettle', 1)
Training on chunk
Samples of onpower: 214
Samples of offpower: 214
Samples of duration: 214
Training onpower
Training offpower
Training duration
('kettle', 2)
Training on chunk
Samples of onpower: 92
Samples of offpower: 92
Samples of duration: 92
Training onpower
Training offpower
Training duration
('kettle', 3)
Chunk empty
Retraining onpower
Retraining offpower
Retraining duration

Una vez que tengamos la distribución del modelo final para cada característica. Necesitamos la integridad de cada distribución. Cada CDF debe estar delimitado por uno.

mle.check_cdfIntegrity(step=10)

Onpower cdf: 0.986177684776
Offpower cdf: 1.0
Duration cdf: 0.987375070732

Desagregación

# Building to disaggregate: 
building = 2
mains = test.buildings[building].elec.mains()

# File to store the disaggregation
filename= '/home/energos/Escritorio/ukdale-disag-ml.h5'
output = HDFDataStore(filename, 'w')

El siguiente paso tomará unos minutos.

mle.disaggregate(mains, output)

25656 events found.
12419 onEvents found
4244 onEvents no paired.
1 chunks disaggregated

También recibimos cierta información, como el número total de eventos, el número de eventos de encendido, el número de eventos que no se han emparejado y los fragmentos desglosados.

Comparando la desagregación con la verdad básica

## Groundtruth
kettle = test.buildings[building].elec.select_using_appliances(type=applianceName)
output.load(mains.key).next().plot()
kettle.plot()
output.close()

Conjuntos de datos públicos para NIALM


Es esencial utilizar datos del mundo real al comparar el rendimiento de las técnicas NIALM. Sin embargo, estos conjuntos de datos requieren mucho tiempo, son costosos y, a menudo, son incómodos de recopilar. Con este fin, los investigadores han comenzado a publicar sus conjuntos de datos, lo que permite a otros investigadores comparar sus enfoques con puntos de referencia comunes.

Photo by Constantine Kim on Pexels.com

 A continuación vamos a mostrar algunas descripciones breves de los conjuntos de datos ( DataSets) :

Conjunto de datos de almanaque de energía mínima (AMPds)

Stephen Makonin lanzó la primera versión del  conjunto de datos Almanac of Minutely Power . El conjunto de datos contiene lecturas de medidor agregadas de 1 minuto, así como lecturas submedidas de 19 circuitos individuales. Cada lectura incluye medidas de voltaje, corriente, frecuencia, factor de potencia, potencia real, potencia reactiva y potencia aparente. Además, el consumo total de gas y agua también se midió a intervalos de 1 minuto, además de 1 uso individual para cada servicio. El conjunto de datos abarca un año completo desde abril de 2012 hasta marzo de 2013 de un solo hogar en el área metropolitana de Vancouver, BC, Canadá.

El conjunto de datos está disponible para cualquier persona de forma gratuita, aunque los autores requieren que se solicite un nombre de usuario y una contraseña para realizar un seguimiento del uso.

Conjunto de datos de desagregación energética de Berkeley (BERDS)

La Universidad de California, Berkley, ha publicado datos de electricidad recopilados del Cory Hall en el campus de UC Berkeley. El conjunto de datos contiene datos recopilados de 4 categorías de cargas submedidas: iluminación, HVAC, receptáculo (enchufes) y otros, para los cuales hay muchas fuentes disponibles para cada categoría de carga.

 El conjunto de datos contiene mediciones de potencia activa, reactiva y aparente que se recopilaron a intervalos de 20 segundos. Los datos están disponibles de forma gratuita a través  del sitio web de Mehdi Maasoumy , y un  documento que  describe brevemente el conjunto de datos apareció en el  taller Big Learning en NIPS 2013 .

Un conjunto de datos de entorno de oficina a nivel de edificio de electrodomésticos típicos (BLOND)

Thomas Kriechbaumer y Hans-Arno Jacobsen de la Universidad Técnica de Munich (TUM) lanzaron recientemente el conjunto de datos BLOND, que contiene lecturas de voltaje y corriente para circuitos agregados y datos de verdad de tierra totalmente etiquetados (mediciones de aparatos individuales). El estudio cubre 53 aparatos (16 clases) en una red eléctrica trifásica en Alemania.

 Los autores han publicado dos versiones del conjunto de datos: 1) BLOND-50 contiene 213 días de mediciones muestreadas a 50 kHz (agregado) y 6.4 kHz (aparatos individuales), 2) BLOND-250 consta de la misma configuración: 50 días, 250 kHz (agregado), 50 kHz (aparatos individuales). El conjunto de datos también se describe con más detalle en el artículo de Datos científicos .

Conjunto de datos de desagregación de electricidad completamente etiquetado a nivel de edificio (BLUED)

El conjunto de datos BLUED contiene datos a nivel de hogar de alta frecuencia (12 kHz) de un solo hogar de EE. UU. Durante un período de aproximadamente 8 días. El conjunto de datos también contiene una lista de eventos de cada vez que un electrodoméstico dentro del hogar cambia de estado (por ejemplo, se enciende el microondas). 

Este conjunto de datos se recopiló principalmente para la evaluación de métodos NIALM basados ​​en eventos.  Los autores también tienen acceso protegido con contraseña al conjunto de datos para realizar un seguimiento de su uso.

Conjunto de datos de biblioteca de cargas controladas de encendido / apagado (COOLL)

El conjunto de datos COOLL fue publicado por investigadores del laboratorio PRISME de la Universidad de Orleans, que contiene alta frecuencia de 12 tipos diferentes de aparatos. De manera similar a los conjuntos de datos de tracebase y PLAID, se midieron varias instancias de cada tipo, y cada instancia se midió a lo largo de 20 operaciones. Durante cada operación controlada, se recopilaron datos de corriente y voltaje a una frecuencia de muestreo de 100 kHz. El conjunto de datos se resume en un  artículo académico y se puede  descargar de github  después de completar un formulario de registro.

Base de datos de  puerto de datos (anteriormente WikiEnergy)

Pecan Street Inc  ha publicado una gran cantidad de datos de electricidad doméstica a través de la  iniciativa Dataport.Al  momento de escribir este artículo, los datos contienen datos de 669 hogares, en los que tanto la demanda de energía agregada de los hogares como las demandas de energía de los electrodomésticos individuales se monitorean en intervalos de 1 minuto. Las instalaciones comenzaron en enero de 2011 y todavía se están recopilando datos para la mayoría de los edificios. 

Los datos están disponibles gratuitamente para los miembros de la Universidad de la comunidad WikiEnergy, y los detalles completos para el acceso a la base de datos se pueden encontrar en la  página de inicio de Dataport .

Conjunto de datos de demanda de electricidad doméstica de electrodomésticos individuales en Alemania (DEDDIAG)

Marc Wenninger, Andreas Maier y Jochen Schmidt han lanzado  DEDDIAG , un conjunto de datos de demanda de electricidad doméstica de electrodomésticos individuales en Alemania. El conjunto de datos contiene grabaciones de 15 hogares durante un período de hasta 3,5 años, en los que se han registrado 50 aparatos a una frecuencia de 1 Hz. El conjunto de datos se centra en electrodomésticos de importancia para fines de cambio de carga, como lavavajillas, lavadoras y refrigeradores. Una casa también incluye lecturas de red trifásica que se pueden utilizar para tareas de desagregación.

Además, DEDDIAG contiene anotaciones manuales de eventos de verdad en tierra para 14 dispositivos, que proporcionan marcas de tiempo precisas de inicio y parada. Los autores también han publicado el  código fuente del sistema de recopilación de datos., así como una  herramienta de línea de comandos de Python  para cargar los datos.

Conjunto de datos de energía residencial holandés (DRED)

La Universidad Tecnológica de Delft (TUDelft) ha publicado un conjunto de datos DRED, que contiene información sobre el consumo de energía tanto a nivel de la casa como del electrodoméstico. El despliegue en vivo consta de varios sensores que miden la electricidad, la ocupación de los ocupantes y los parámetros ambientales en un hogar.

 El conjunto de datos DRED incluye datos de electricidad (consumo de energía agregado y consumo de energía a nivel del aparato), información ambiental (temperatura interior a nivel de la habitación, temperatura exterior, parámetros ambientales), información de ocupación (información de ubicación de los ocupantes a nivel de la habitación, información de WiFi y BT RSSI para localización) e información del hogar (diseño de la casa, número de electrodomésticos monitoreados, mapeo de ubicación de electrodomésticos, etc.).

 El conjunto de datos está disponible públicamente y se puede obtener en el  sitio web de DRED..

Conjunto de datos de consumo y ocupación de electricidad (ECO)

El conjunto de datos ECO es un conjunto de datos para el monitoreo de carga no intrusivo y la investigación de detección de ocupación. Se recogió en 6 hogares suizos durante un período de 8 meses. Para cada uno de los hogares, el conjunto de datos ECO proporciona datos de consumo agregado de 1 Hz (corriente, voltaje y cambio de fase para cada una de las tres fases en el hogar) y también datos de nivel de enchufe de 1 Hz medidos de electrodomésticos seleccionados. 

Además, el conjunto de datos también incluye información de ocupación medida a través de una tableta (etiquetado manual) y un sensor de infrarrojos pasivo (en algunos hogares).

 El conjunto de datos se describe en detalle en un artículo publicado en BuildSys 2014.

Conjunto de datos GREEND

El conjunto de datos GREEND fue publicado por una colaboración entre investigadores de la  Alpen-Adria-Universität Klagenfurt  y  WiTiKee srl . 

El conjunto de datos contiene mediciones de potencia activa tomadas a intervalos de 1 segundo de 9 electrodomésticos individuales y la demanda de energía total de los hogares de 9 casas en Italia y Austria, durante un período de hasta un año. Se pueden encontrar más detalles en el  documento arXiv adjunto . 

Además,  también está disponible un  convertidor NILMTK para el conjunto de datos.

Estudio de uso de electricidad en el hogar (HES)

En 2012, el Energy Savings Trust del Reino Unido  , el  Departamento de Energía y Cambio Climático y el  Departamento de Medio Ambiente, Alimentación y Asuntos Rurales  publicaron un informe de 15 páginas llamado  Powering the Nation . Este informe resume el estudio completo de 600 páginas sobre el  uso de electricidad en el hogar., cuyo objetivo era comprender mejor cómo se consume la electricidad en los hogares del Reino Unido. 

Como parte de este estudio, se monitorearon 251 hogares ocupantes de propietarios en Inglaterra entre abril de 2010 y abril de 2011. De estos hogares, 26 fueron monitoreados durante 12 meses y 225 durante 1 mes. Para cada hogar, se controló el consumo de energía de 13-51 electrodomésticos a intervalos de 2 minutos.

 Actualmente se está desarrollando un portal de software para proporcionar acceso al conjunto de datos, aunque mientras tanto, los datos pueden solicitarse individualmente a  ICF International  contactando  [email protected]  y proporcionando una dirección postal y detalles del sistema operativo.

Conjunto de datos de energía del hogar IDEAL 

Publicado por investigadores de la Universidad de Edimburgo, el conjunto de datos de energía del hogar IDEAL comprende datos de 255 hogares del Reino Unido. Junto con los datos de electricidad y gas de cada hogar, el corpus contiene lecturas individuales de temperatura y humedad de la habitación y lecturas de temperatura de la caldera. Para 39 de los 255 hogares, se dispone de datos más detallados, incluidos datos sobre el uso de aparatos eléctricos individuales y datos sobre radiadores individuales. 

Los datos de los sensores se incrementan con datos de encuestas anonimizados y metadatos, incluidos los datos demográficos de los ocupantes, la conciencia y las actitudes energéticas autoinformadas, y las características del edificio, la habitación y los electrodomésticos.

Conjunto de datos de la India para el agua y la energía ambientales (iAWE)

El Instituto Indraprastha de Tecnología de la Información publicó recientemente el  conjunto de  datos iAWE , que contiene datos agregados y submedidos de electricidad y gas de 33 sensores domésticos con una resolución de 1 segundo. 

El conjunto de datos cubre 73 días de una sola casa en Delhi, India. Cada canal individual de datos se puede descargar por separado en formato SQL o CSV desde la sección de descarga en la parte inferior de la página web.

Conjunto de datos de consumo de energía eléctrica individual del hogar 

EDF Energy publicó un conjunto de datos en 2012 que contiene mediciones de energía realizadas en un solo hogar en Francia durante 4 años. Las mediciones promedio están disponibles a una resolución de 1 minuto de la potencia activa, la potencia reactiva, la tensión y la corriente agregadas del hogar, así como la potencia activa de 3 circuitos submedidos. 

Aunque cada circuito contiene algunos aparatos, este es el conjunto de datos más grande en términos de duración de la medición. 

El conjunto de datos completo está disponible de forma abierta en el Repositorio de aprendizaje automático de la  UCI .

Pecan Street Research Institute  (ya no está disponible)

Pecan Street Research Institute  anunció el lanzamiento de un nuevo conjunto de datos  diseñado específicamente para permitir la evaluación de la tecnología de desagregación de electricidad. Un conjunto de datos de muestra gratuito está disponible para los miembros de su consorcio de investigación, que ahora se ha abierto a los investigadores universitarios. El conjunto de datos de muestra contiene 7 días de datos de 10 casas en Austin, TX, EE. UU., Para los cuales también se encuentran disponibles datos agregados y de circuito que contienen lecturas de potencia en intervalos de 1 minuto. Además de las cargas domésticas comunes, 2 de las casas también tienen sistemas fotovoltaicos y 1 casa también tiene un vehículo eléctrico.

Conjunto de datos de desagregación energética de referencia (REDD)

REDD contiene datos tanto a nivel de hogar como a nivel de circuito de 6 hogares de EE. UU., Durante varias duraciones (entre unas pocas semanas y unos meses). Cada casa tiene una entrada de red bifásica y de 10 a 25 circuitos monitoreados individualmente.

 Los datos de corriente y voltaje de alta frecuencia  (kHz)  están disponibles para ambos circuitos de red, mientras que las mediciones de potencia de baja frecuencia (intervalos de 3-4 segundos) están disponibles para los circuitos del aparato.  

Este conjunto de datos se recopiló principalmente para la evaluación de métodos NIALM no basados ​​en eventos.  Los autores tienen acceso protegido con contraseña al conjunto de datos para realizar un seguimiento de su uso.

REFIT del conjunto de datos de medidas de carga eléctrica

El conjunto de datos REFIT fue publicado como parte del proyecto  Smart Home and Energy Demand Reduction  , por  David Murray  y  Lina Stankovic. en la Universidad de Strathclyde. El conjunto de datos contiene mediciones de potencia activa del agregado y 9 aparatos individuales de 20 hogares en el área de Loughborough del Reino Unido, con una resolución de 1 muestra cada 8 segundos. Esto convierte al REFIT en el único conjunto de datos del Reino Unido que contiene datos a nivel de electrodomésticos a una frecuencia de muestreo superior a una vez por minuto.

Además, los datos agregados de consumo de gas también se registraron a intervalos de 30 minutos. Sin embargo, debe tenerse en cuenta que los datos se comprimieron al eliminar muestras para las que la demanda de energía no había cambiado desde la última lectura.

Se pueden encontrar más detalles en una  presentación de la conferencia EEDAL 2015 ,  un informe técnico detallado y el archivo Léame del conjunto de datos  .. Además,  también está disponible un  convertidor NILMTK para el conjunto de datos.

Conjunto de datos de Smart * Home  (a través del UMassTraceRepository)

Aunque no se recopila específicamente para el desglose de energía, el conjunto de datos Smart * (Smart Star) proporciona datos de energía de 3 hogares reales submedidos. La granularidad de los datos recopilados para los monitores de nivel de circuito (conjunto de instalaciones y circuitos individuales) es de una lectura por segundo, mientras que las cargas de los enchufes individuales se miden aproximadamente cada pocos segundos. Cada casa contiene de 21 a 26 medidores de circuito y casi todos los electrodomésticos se miden con medidores de enchufe. Por el momento, los datos agregados, de circuitos y de electrodomésticos están disponibles para la casa A, pero solo los datos agregados están disponibles para las casas B y C.

Tracebase

El  repositorio de tracebase  contiene datos de dispositivos individuales con la intención de crear una base de datos para entrenar algoritmos NIALM. El repositorio contiene un total de 1883 días de lecturas de energía, tomadas a intervalos de 1 segundo, para 158 instancias de dispositivos, de 43 tipos de dispositivos diferentes. 

Dado que el objetivo es crear una base de datos de dispositivos, no se recopilan medidas agregadas. Los datos se introducen en  Reinhardt et al. 2012  y está disponible en el  repositorio de tracebase . 

Los archivos están protegidos con contraseña, pero se puede solicitar una contraseña a través de la  página de descarga .

Conjunto de datos de electricidad a nivel de electrodomésticos del Reino Unido (UK-DALE)

Jack Kelly lanzó la primera versión de UK-DALE en enero de 2015. El conjunto de datos contiene lecturas de medidores agregados de voltaje y corriente de 16 kHz y datos de energía submedidos de 6 segundos de electrodomésticos individuales en 3 hogares del Reino Unido, así como un agregado de 1 segundo y Datos de potencia submedidos de 6 segundos para 2 hogares adicionales. En agosto de 2015 se publicó una actualización del conjunto de datos que amplió los datos disponibles para la casa 1 a 2,5 años

 Los datos de baja frecuencia están disponibles para descargar en formato CSV o NILMTK HDF5, mientras que los datos de alta frecuencia se pueden descargar en formato de archivo FLAC.

Fuente https://blog.oliverparson.co.uk/2012/06/public-data-sets-for-nialm.html