import pandas as pd
import numpy as np
import matplotlib

import matplotlib.pyplot as plt
matplotlib.style.use('ggplot')
%matplotlib notebook
import mpld3
mpld3.enable_notebook()

# Set plot styles
plt.rcParams['figure.figsize'] = [8, 8]
plt.rcParams.update({'font.size': 8})
plt.rcParams.update({'lines.linewidth': 1})


# Generate data
np.random.seed(42)
n = 500
time = pd.date_range('2023-01-01', periods=n, freq='5min')

# Data 1 - Smoothly changing sinusoidal with noise
# Represents a typical signal you want to filter 
data1 = np.sin(np.arange(n)/5) + np.random.normal(0, 0.1, size=n) 

# Data 2 - Square wave with noise
# Tests filter ability to retain edges
data2 = np.zeros(n)
data2[100:200] = 1 
data2[300:400] = -1
data2 += np.random.normal(0, 0.02, size=n)

# Data 3 - Sinusoidal with outliers
# Tests robustness of filters to outliers
data3 = np.sin(np.arange(n)/5) + np.random.normal(0, 0.1, size=n)
data3[20] += 10
data3[150] -= 9 
data3[200] += 10
data3[350] -= 6 

df = pd.DataFrame({'time': time, 'data1': data1, 'data2': data2, 'data3': data3})


datasets = ['data1', 'data2', 'data3']
fig, axes = plt.subplots(ncols=1, nrows=3)
for i, dataset in enumerate(datasets):
   ax = axes[i]
   ax.plot(df.time, df[dataset], label='Original')
   ax.legend()
plt.tight_layout()
plt.show()


# (a) Moving average
datasets = ['data1', 'data2', 'data3']
windows = [5, 10, 20, 50]
fig, axes = plt.subplots(ncols=1, nrows=3)
for i, dataset in enumerate(datasets):
   ax = axes[i]
   ax.plot(df.time, df[dataset], color='black', label='Original')
   for window in windows:
       avg = df[dataset].rolling(window).mean()  
       ax.plot(df.time, avg, label='Window = {}'.format(window))
   ax.set_title('Moving Avg on {}'.format(dataset))
   ax.legend()
plt.tight_layout()
plt.show()


# (b) Exponential Moving Average
alphas = [0.1, 0.3, 0.5, 0.7]  
fig, axes = plt.subplots(ncols=1, nrows=3)
for i, dataset in enumerate(datasets):
    ax = axes[i]
    for alpha in alphas:
        exp = df[dataset].ewm(alpha=alpha).mean() 
        ax.plot(df.time, exp, label='Alpha={}'.format(alpha))
    ax.plot(df.time, df[dataset], color='black', label='Original')
    ax.set_title('Exp Moving Avg on {}'.format(dataset))
    ax.legend()
plt.tight_layout()
plt.show()


# (c) Median Filter
windows = [5, 10, 20, 50]
fig, axes = plt.subplots(ncols=1, nrows=3)
for i, dataset in enumerate(datasets):
    ax = axes[i]
    for window in windows:
        roll_med = df[dataset].rolling(window).median()
        ax.plot(df.time, roll_med, label='Window {}'.format(window))
    ax.plot(df.time, df[dataset], color='black', label='Original') 
    ax.set_title('Median Filter on {}'.format(dataset))
    ax.legend()
plt.tight_layout()
plt.show()


# (d) Compare all filters on each dataset
datasets = ['data1', 'data2', 'data3']
filters = ['ma', 'exp', 'med'] 
params = [{'window': 10}, {'alpha': 0.5}, {'window': 10}]

fig, axes = plt.subplots(ncols=1, nrows=3)

for i, dataset in enumerate(datasets):
    
    ax = axes[i]
    ax.plot(df.time, df[dataset], color='black', label='Original')
    
    for filter, param in zip(filters, params):
        if filter=='ma':
            y = df[dataset].rolling(**param).mean()
        elif filter=='exp':
            y = df[dataset].ewm(**param).mean()
        else:
            y = df[dataset].rolling(**param).median()
            
        ax.plot(df.time, y, label=filter)
        
    ax.set_title('Filters on {}'.format(dataset)) 
    ax.legend()
    
plt.tight_layout()
plt.show()

Example: Time domain noise removal¶

Create three different types of signals¶

Moving average¶

Exponential moving average¶

Median filter¶

Comparison of moving avg, exponential and median filters¶