Spaces:

Multichem-PD
/

DFS_Portfolio_Manager

Running

App Files Files Community

James McCool commited on Sep 1

Commit

872a007

1 Parent(s): d01aca2

introduced a button to recalculate diversity

Browse files

Files changed (2) hide show

app.py +5 -1
global_func/recalc_diversity.py +59 -0

app.py CHANGED Viewed

@@ -27,6 +27,7 @@ from global_func.analyze_player_combos import analyze_player_combos
 from global_func.stratification_function import stratification_function
 from global_func.exposure_spread import exposure_spread
 from global_func.reassess_edge import reassess_edge
 freq_format = {'Finish_percentile': '{:.2%}', 'Lineup Edge': '{:.2%}', 'Win%': '{:.2%}'}
 stacking_sports = ['MLB', 'NHL', 'NFL', 'LOL', 'NCAAF']
@@ -1829,7 +1830,7 @@ if selected_tab == 'Manage Portfolio':
                         st.session_state['export_file'][col] = st.session_state['export_file'][col].map(position_dict)
             if 'export_file' in st.session_state:
-                download_port, merge_port, partial_col, clear_export, blank_export_col = st.columns([1, 1, 1, 1, 8])
                 with download_port:
                     st.download_button(label="Download Portfolio", data=st.session_state['export_file'].to_csv(index=False), file_name="portfolio.csv", mime="text/csv")
                 with merge_port:
@@ -1851,6 +1852,9 @@ if selected_tab == 'Manage Portfolio':
                             st.session_state['display_frame'] = st.session_state['working_frame']
                         elif display_frame_source == 'Export Base':
                             st.session_state['display_frame'] = st.session_state['export_base']
             total_rows = len(st.session_state['display_frame'])
             rows_per_page = 100

 from global_func.stratification_function import stratification_function
 from global_func.exposure_spread import exposure_spread
 from global_func.reassess_edge import reassess_edge
+from global_func.recalc_diversity import recalc_diversity
 freq_format = {'Finish_percentile': '{:.2%}', 'Lineup Edge': '{:.2%}', 'Win%': '{:.2%}'}
 stacking_sports = ['MLB', 'NHL', 'NFL', 'LOL', 'NCAAF']
                         st.session_state['export_file'][col] = st.session_state['export_file'][col].map(position_dict)
             if 'export_file' in st.session_state:
+                download_port, merge_port, partial_col, clear_export, recalc_div_col, blank_export_col = st.columns([1, 1, 1, 1, 1, 8])
                 with download_port:
                     st.download_button(label="Download Portfolio", data=st.session_state['export_file'].to_csv(index=False), file_name="portfolio.csv", mime="text/csv")
                 with merge_port:
                             st.session_state['display_frame'] = st.session_state['working_frame']
                         elif display_frame_source == 'Export Base':
                             st.session_state['display_frame'] = st.session_state['export_base']
+                with recalc_div_col:
+                    if st.button("Recalculate Diversity"):
+                        st.session_state['display_frame']['Diversity'] = recalc_diversity(st.session_state['display_frame'], player_columns)
             total_rows = len(st.session_state['display_frame'])
             rows_per_page = 100

global_func/recalc_diversity.py ADDED Viewed

	@@ -0,0 +1,59 @@

+import streamlit as st
+import numpy as np
+import pandas as pd
+import time
+import math
+from difflib import SequenceMatcher
+def recalc_diversity(portfolio, player_columns):
+    """
+    Vectorized version of recalc_diversity using NumPy operations.
+    """
+    # Extract player data and convert to string array
+    player_data = portfolio[player_columns].astype(str).fillna('').values
+    # Get all unique players and create a mapping to numeric IDs
+    all_players = set()
+    for row in player_data:
+        for val in row:
+            if isinstance(val, str) and val.strip() != '':
+                all_players.add(val)
+    # Create player ID mapping
+    player_to_id = {player: idx for idx, player in enumerate(sorted(all_players))}
+    # Convert each row to a binary vector (1 if player is present, 0 if not)
+    n_players = len(all_players)
+    n_rows = len(portfolio)
+    binary_matrix = np.zeros((n_rows, n_players), dtype=np.int8)
+    # Vectorized binary matrix creation
+    for i, row in enumerate(player_data):
+        for val in row:
+            if isinstance(val, str) and str(val).strip() != '' and str(val) in player_to_id:
+                binary_matrix[i, player_to_id[str(val)]] = 1
+    # Vectorized Jaccard distance calculation
+    intersection_matrix = np.dot(binary_matrix, binary_matrix.T)
+    row_sums = np.sum(binary_matrix, axis=1)
+    union_matrix = row_sums[:, np.newaxis] + row_sums - intersection_matrix
+    # Calculate Jaccard distance: 1 - (intersection / union)
+    with np.errstate(divide='ignore', invalid='ignore'):
+        jaccard_similarity = np.divide(intersection_matrix, union_matrix,
+                                     out=np.zeros_like(intersection_matrix, dtype=float),
+                                     where=union_matrix != 0)
+    jaccard_distance = 1 - jaccard_similarity
+    # Exclude self-comparison and calculate average distance for each row
+    np.fill_diagonal(jaccard_distance, 0)
+    row_counts = n_rows - 1
+    similarity_scores = np.sum(jaccard_distance, axis=1) / row_counts
+    # Normalize to 0-1 scale
+    score_range = similarity_scores.max() - similarity_scores.min()
+    if score_range > 0:
+        similarity_scores = (similarity_scores - similarity_scores.min()) / score_range
+    return similarity_scores