Young Wu's Homepage

# Bandit Configuration

T (number of rounds): to (number of trials )
N (number repetition):
Reward means: or default:
(Optional) number of players: , number of actions:
Reward lower bound: , upper bound:
Reward distribution:
Method:
Parameter 1:
Parameter 2:
Parameter 3:

Regret:
Expected regret: , variance:

# Attack Configuration

Target:
Alpha:
Epsilon:
Reward at t = :

Cost:
Expected cost: , variance:

Last Updated: December 14, 2022 at 1:43 AM