AlgoPlus/metrics_8h_source.html

#ifndef MEAN_SQUARED_ERROR_H

#define MEAN_SQUARED_ERROR_H


#ifdef __cplusplus

#include <algorithm>

#include <cassert>

#include <cmath>

#include <iostream>

#include <numbers>

#include <numeric>

#include <vector>

#endif


namespace _metrics_utils {

inline double sigmoid(const double x) {

    return 1.0 / (1.0 + exp(-x));

}


inline std::vector<double> softmax(const std::vector<double>& logits) {

    double sum_logits = 0;

    for (const double& x : logits) {

        sum_logits += exp(x);

    }


    std::vector<double> probs;

    for (const double& x : logits) {

        probs.push_back(exp(x) / sum_logits);

    }


    return probs;

}

} // namespace _metrics_utils


namespace metrics {


namespace multi_metrics_ {

inline std::tuple<int, int, int, int> all_metrics_(const std::vector<double>& y,

                                                   const std::vector<double>& y_pred) {

    assert(y.size() == y_pred.size());

    int tp = 0, tn = 0, fp = 0, fn = 0;

    for (size_t i = 0; i < y.size(); i++) {

        if (y_pred[i] == y[i] && y[i] == 1) {

            tp += 1;

        } else if (y_pred[i] == y[i] && y[i] == 0) {

            tn += 1;

        } else if (y_pred[i] != y[i] && y[i] == 1) {

            fn += 1;

        } else if (y_pred[i] != y[i] && y[i] == 0) {

            fp += 1;

        }

    }


    return {tp, tn, fp, fn};

}

} // namespace multi_metrics_


inline double recall(const std::vector<double>& y, const std::vector<double>& y_pred) {

    auto [tp, tn, fp, fn] = multi_metrics_::all_metrics_(y, y_pred);

    return 1.0 * (tp) / (tp + fn);

}


inline double accuracy_score(const std::vector<double>& y, const std::vector<double>& y_pred) {

    auto [tp, tn, fp, fn] = multi_metrics_::all_metrics_(y, y_pred);

    return 1.0 * (tp + tn) / (tp + tn + fp + fn);

}


inline double precision(const std::vector<double>& y, const std::vector<double>& y_pred) {

    auto [tp, tn, fp, fn] = multi_metrics_::all_metrics_(y, y_pred);

    return 1.0 * tp / (tp + fp);

}


inline double f1_score(const std::vector<double>& y, const std::vector<double>& y_pred) {

    auto [tp, tn, fp, fn] = multi_metrics_::all_metrics_(y, y_pred);

    double prec = precision(y, y_pred), rec = recall(y, y_pred);

    return 2.0 * (prec * rec) / (prec + rec);

}


inline double euclidean_distance(const std::vector<double>& x, const std::vector<double>& y) {

    assert(x.size() == y.size());


    double _dist = 0.0;

    for (size_t i = 0; i < x.size(); i++) {

        _dist += std::pow(y[i] - x[i], 2);

    }


    return std::sqrt(_dist);

}


inline double manhattan_distance(const std::vector<double>& x, const std::vector<double>& y) {

    assert(x.size() == y.size());


    double _dist = 0.0;

    for (size_t i = 0; i < x.size(); i++) {

        _dist += std::abs(y[i] - x[i]);

    }


    return _dist;

}


inline double minkowski_distance(const std::vector<double>& x, const std::vector<double>& y,

                                 const double p) {

    assert(x.size() == y.size());


    double _dist = 0.0;

    for (size_t i = 0; i < x.size(); i++) {

        _dist += std::abs(y[i] - x[i]);

    }


    return std::pow(_dist, 1.0 / p);

}


namespace losses {

inline double mean_squared_error(const std::vector<double>& y, const std::vector<double>& y_hat) {

    assert(y.size() == y_hat.size());

    size_t n = y.size();

    double mse = 0.0;

    for (size_t i = 0; i < n; i++) {

        mse += std::pow(y[i] - y_hat[i], 2);

    }

    return mse / double(n);

}


inline double root_mean_squared_error(std::vector<double> const& y,

                                      std::vector<double> const& y_hat) {

    return std::sqrt(mean_squared_error(y, y_hat));

}


inline double mean_absolute_error(std::vector<double> const& y, std::vector<double> const& y_hat) {

    assert(y.size() == y_hat.size());

    size_t n = y.size();

    double mae = 0.0;

    for (size_t i = 0; i < n; i++) {

        mae += std::abs(y[i] - y_hat[i]);

    }

    return mae / double(n);

}


inline double binary_crossentropy_loss(std::vector<double> const& y,

                                       std::vector<double> const& y_hat) {

    assert(y.size() == y_hat.size());

    for (auto& x : y) {

        assert(x == 0.0 || x == 1.0);

    }


    size_t n = y.size();

    double bce = 0.0, eps = 1e-15;

    for (size_t i = 0; i < n; i++) {

        double prob = _metrics_utils::sigmoid(y_hat[i]);

        double clipped_y_hat = std::clamp(prob, eps, 1 - eps);

        bce += (y[i] * log(clipped_y_hat) + (1 - y[i]) * log(1 - clipped_y_hat));

    }

    return -bce / double(n);

}

} // namespace losses

} // namespace metrics


#endif

metrics
losses namespace that contains a couple of useful losses in machine learning
Definition metrics.h:39

metrics::euclidean_distance
double euclidean_distance(const std::vector< double > &x, const std::vector< double > &y)
euclidean distance function
Definition metrics.h:111

metrics::manhattan_distance
double manhattan_distance(const std::vector< double > &x, const std::vector< double > &y)
manhattan distance function
Definition metrics.h:128

metrics::f1_score
double f1_score(const std::vector< double > &y, const std::vector< double > &y_pred)
f1 score function: [2 * precision * recall / precision + recall]
Definition metrics.h:99

metrics::minkowski_distance
double minkowski_distance(const std::vector< double > &x, const std::vector< double > &y, const double p)
minkowski distance
Definition metrics.h:146

metrics::accuracy_score
double accuracy_score(const std::vector< double > &y, const std::vector< double > &y_pred)
accuracy score function[(tp + tn) / (tp + tn + fp + fn)]
Definition metrics.h:81

metrics::recall
double recall(const std::vector< double > &y, const std::vector< double > &y_pred)
recall function[tp / tp + fn]
Definition metrics.h:72

metrics::precision
double precision(const std::vector< double > &y, const std::vector< double > &y_pred)
precision function[tp / tp + fp]
Definition metrics.h:90