当前位置: 代码迷 >> 综合 >> bzoj1076(概率与期望dp入门)
  详细解决方案

bzoj1076(概率与期望dp入门)

热度:66   发布时间:2024-01-04 12:51:35.0

题目大意:给定k次弹出宝物的机会,每次随机弹出n种宝物的机会,如果吃过这种宝物的所有前提宝物就可以吃这种宝物,求最优策略的期望得分

看到数据范围果断状压DP- - 不看数据范围害死人- -

至于吃还是不吃 这是个问题

对于这种最优策略的期望DP 我们一般都是从后往前推

枚举每次挑战 枚举此时的状态 枚举宝物是哪种

如果当前的宝物可以吃 就在吃与不吃的后继状态中选择最大值加到当前状态上

如果当前的宝物不能吃 只能选择不吃的后继状态加到当前状态上

最后输出f[1][0]就是答案

 

#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<cstdlib>
using namespace std;
typedef double db;
int n,k;
double f[105][1<<17],sc[17];
int t[17];
int main()
{
scanf("%d%d",&k,&n);
int j;
for (int i=1;i<=n;i++)
{
scanf("%lf",&sc[i]);
while (scanf("%d",&j)&&j!=0) t[i]=t[i]|(1<<(j-1));
}
int S=1<<n;
for (int i=k;i>=1;i--)
{
for (j=0;j<S;j++) 
{
for (int l=1;l<=n;l++) 
{